diff --git a/feed.xml b/feed.xml
index 962f0f7..9fa22cd 100644
--- a/feed.xml
+++ b/feed.xml
@@ -1,4 +1,4 @@
-<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Swalloow Blog]]></title><description><![CDATA[Personal Blog. About Data Science, Data Engineering]]></description><link>https://swalloow.github.io</link><generator>GatsbyJS</generator><lastBuildDate>Sun, 21 Jan 2024 08:22:35 GMT</lastBuildDate><item><title><![CDATA[AI를 통해 진화하는 데이터플랫폼 근황]]></title><description><![CDATA[생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
+<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Swalloow Blog]]></title><description><![CDATA[Personal Blog. About Data Science, Data Engineering]]></description><link>https://swalloow.github.io</link><generator>GatsbyJS</generator><lastBuildDate>Sun, 21 Jan 2024 08:51:51 GMT</lastBuildDate><item><title><![CDATA[AI를 통해 변화하는 데이터플랫폼 근황]]></title><description><![CDATA[생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
 오늘은 데이터플랫폼 영역에서 AI…]]></description><link>https://swalloow.github.io/llm-dataplatform</link><guid isPermaLink="false">https://swalloow.github.io/llm-dataplatform</guid><pubDate>Sun, 21 Jan 2024 00:00:00 GMT</pubDate></item><item><title><![CDATA[Pandas 2.0의 Copy-on-Write에 대하여]]></title><description><![CDATA[Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…]]></description><link>https://swalloow.github.io/pandas-2-0-copy-on-write</link><guid isPermaLink="false">https://swalloow.github.io/pandas-2-0-copy-on-write</guid><pubDate>Sun, 24 Dec 2023 00:00:00 GMT</pubDate></item><item><title><![CDATA[Spark on Kubernetes: 커스텀 스케줄러 (2)]]></title><description><![CDATA[Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…]]></description><link>https://swalloow.github.io/spark-on-kubernetes-scheduler-2</link><guid isPermaLink="false">https://swalloow.github.io/spark-on-kubernetes-scheduler-2</guid><pubDate>Sun, 10 Dec 2023 00:00:00 GMT</pubDate></item><item><title><![CDATA[Spark on Kubernetes: 커스텀 스케줄러 (1)]]></title><description><![CDATA[Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…]]></description><link>https://swalloow.github.io/spark-on-kubernetes-scheduler</link><guid isPermaLink="false">https://swalloow.github.io/spark-on-kubernetes-scheduler</guid><pubDate>Thu, 08 Jun 2023 00:00:00 GMT</pubDate></item><item><title><![CDATA[베를린에서 2개월 살아남기]]></title><description><![CDATA[우연히 회사에서 좋은 기회를 얻게 되어 독일에서…]]></description><link>https://swalloow.github.io/berlin</link><guid isPermaLink="false">https://swalloow.github.io/berlin</guid><pubDate>Wed, 10 May 2023 00:00:00 GMT</pubDate></item><item><title><![CDATA[MLOps 관련 책, 강의 리뷰 (DMLS, FSDL)]]></title><description><![CDATA[MLOps…]]></description><link>https://swalloow.github.io/mlops-dmls-fsdl</link><guid isPermaLink="false">https://swalloow.github.io/mlops-dmls-fsdl</guid><pubDate>Tue, 13 Sep 2022 00:00:00 GMT</pubDate></item><item><title><![CDATA[Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들]]></title><description><![CDATA[스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…]]></description><link>https://swalloow.github.io/spark-on-kubernetes-spot-instance</link><guid isPermaLink="false">https://swalloow.github.io/spark-on-kubernetes-spot-instance</guid><pubDate>Sat, 23 Jul 2022 00:00:00 GMT</pubDate></item><item><title><![CDATA[쿠버네티스에서 GPU 리소스를 효율적으로 활용하는 방법]]></title><description><![CDATA[GPU는 강력한 연산 기능을 제공하지만 비용이 많이 들기 때문에 제한된 리소스를 효율적으로 활용하는 것이 중요합니다. 이번 글에서는 NVIDIA…]]></description><link>https://swalloow.github.io/gpu-utilization</link><guid isPermaLink="false">https://swalloow.github.io/gpu-utilization</guid><pubDate>Fri, 08 Jul 2022 00:00:00 GMT</pubDate></item><item><title><![CDATA[Airflow worker에 KEDA AutoScaler 적용한 후기]]></title><description><![CDATA[Airflow…]]></description><link>https://swalloow.github.io/airflow-worker-keda-autoscaler</link><guid isPermaLink="false">https://swalloow.github.io/airflow-worker-keda-autoscaler</guid><pubDate>Fri, 24 Jun 2022 00:00:00 GMT</pubDate></item><item><title><![CDATA[컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)]]></title><description><![CDATA[쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…]]></description><link>https://swalloow.github.io/container-tini-dumb-init</link><guid isPermaLink="false">https://swalloow.github.io/container-tini-dumb-init</guid><pubDate>Fri, 27 May 2022 00:00:00 GMT</pubDate></item><item><title><![CDATA[EKS Karpenter를 활용한 Groupless AutoScaling]]></title><description><![CDATA[21년 12월 EKS에서 새로운 쿠버네티스 클러스터 오토스케일러인 Karpenter…]]></description><link>https://swalloow.github.io/eks-karpenter-groupless-autoscaling</link><guid isPermaLink="false">https://swalloow.github.io/eks-karpenter-groupless-autoscaling</guid><pubDate>Fri, 13 May 2022 00:00:00 GMT</pubDate></item><item><title><![CDATA[개발자가 의사결정을 기록하는 방법 (feat. ADR)]]></title><description><![CDATA[…]]></description><link>https://swalloow.github.io/feat-adr</link><guid isPermaLink="false">https://swalloow.github.io/feat-adr</guid><pubDate>Sat, 04 Dec 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[JupyterHub에 Tensorboard 연동하기]]></title><description><![CDATA[이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…]]></description><link>https://swalloow.github.io/jupyterhub-tensorboard</link><guid isPermaLink="false">https://swalloow.github.io/jupyterhub-tensorboard</guid><pubDate>Sat, 23 Oct 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[JupyterHub on Kubernetes]]></title><description><![CDATA[일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.
 이 글에서는 zero-to…]]></description><link>https://swalloow.github.io/jupyterhub-on-kubernetes</link><guid isPermaLink="false">https://swalloow.github.io/jupyterhub-on-kubernetes</guid><pubDate>Sat, 23 Oct 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[Data Mesh 아키텍쳐의 네 가지 원칙]]></title><description><![CDATA[이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…]]></description><link>https://swalloow.github.io/data-mesh-principle</link><guid isPermaLink="false">https://swalloow.github.io/data-mesh-principle</guid><pubDate>Sat, 25 Sep 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[Spark on Kubernetes: 성능 최적화 방법들]]></title><description><![CDATA[Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.
 이 글에서는 Spark on YARN…]]></description><link>https://swalloow.github.io/spark-on-kubernetes-perf</link><guid isPermaLink="false">https://swalloow.github.io/spark-on-kubernetes-perf</guid><pubDate>Sat, 11 Sep 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[여러 조직이 함께 사용하는 Airflow 만들기]]></title><description><![CDATA[…]]></description><link>https://swalloow.github.io/airflow-multi-tenent-1</link><guid isPermaLink="false">https://swalloow.github.io/airflow-multi-tenent-1</guid><pubDate>Sun, 15 Aug 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[사이드카 컨테이너로 Airflow 기능 확장하기]]></title><description><![CDATA[Airflow 2.1 버전부터 공식 Helm Chart…]]></description><link>https://swalloow.github.io/airflow-sidecar</link><guid isPermaLink="false">https://swalloow.github.io/airflow-sidecar</guid><pubDate>Sun, 01 Aug 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[Airflow on Kubernetes (3)]]></title><description><![CDATA[최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…]]></description><link>https://swalloow.github.io/airflow-on-kubernetes-3</link><guid isPermaLink="false">https://swalloow.github.io/airflow-on-kubernetes-3</guid><pubDate>Fri, 05 Feb 2021 00:00:00 GMT</pubDate></item><item><title><![CDATA[Airflow on Kubernetes (2)]]></title><description><![CDATA[최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…]]></description><link>https://swalloow.github.io/airflow-on-kubernetes-2</link><guid isPermaLink="false">https://swalloow.github.io/airflow-on-kubernetes-2</guid><pubDate>Sun, 12 Jul 2020 00:00:00 GMT</pubDate></item><item><title><![CDATA[K8S 클러스터 초기 설정을 위한 Helm Chart 만들기]]></title><description><![CDATA[K8S 클러스터를 설정하고 운영하다보면 버전 업데이트, 컴포넌트 추가 설치 등 다양한 변경에 대응할 수 있어야 합니다. 또한 Develop…]]></description><link>https://swalloow.github.io/umbrella-helm-chart</link><guid isPermaLink="false">https://swalloow.github.io/umbrella-helm-chart</guid><pubDate>Sat, 20 Jun 2020 00:00:00 GMT</pubDate></item><item><title><![CDATA[Airflow on Kubernetes (1)]]></title><description><![CDATA[최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…]]></description><link>https://swalloow.github.io/airflow-on-kubernetes-1</link><guid isPermaLink="false">https://swalloow.github.io/airflow-on-kubernetes-1</guid><pubDate>Fri, 05 Jun 2020 00:00:00 GMT</pubDate></item><item><title><![CDATA[Gatsby와 Contentful로 블로그 이전한 후기]]></title><description><![CDATA[3년 정도 이어왔던 Jekyll 블로그를 Gatsby와 Contentful…]]></description><link>https://swalloow.github.io/gatsby-contentful</link><guid isPermaLink="false">https://swalloow.github.io/gatsby-contentful</guid><pubDate>Sat, 25 Apr 2020 00:00:00 GMT</pubDate></item><item><title><![CDATA[EKS 클러스터에 VPC CIDR 추가하기]]></title><description><![CDATA[앞서 정리했던 EKS의 VPC…]]></description><link>https://swalloow.github.io/eks-cidr</link><guid isPermaLink="false">https://swalloow.github.io/eks-cidr</guid><pubDate>Sat, 14 Mar 2020 00:00:00 GMT</pubDate></item><item><title><![CDATA[AWS Solutions Architect Associate 취득 후기]]></title><description><![CDATA[그동안 관심은 있었지만 굳이 내 돈주고 시험볼 생각이 없었기에 미루고 있다가
diff --git a/index.html b/index.html
index f61d761..f8375a5 100644
--- a/index.html
+++ b/index.html
@@ -68,5 +68,5 @@
   var mode = localStorage.getItem('theme-ui-color-mode');
   if (!mode) return
   document.documentElement.classList.add('theme-ui-' + mode);
-} catch (e) {} })();</script><div id="___gatsby"><style data-emotion="css-global hms875">html{--theme-ui-colors-background:#ffffff;--theme-ui-colors-text:#121212;--theme-ui-colors-primary:#121212;--theme-ui-colors-secondary:#e9e9e9;--theme-ui-colors-tertiary:#f3f3f3;--theme-ui-colors-highlight:#5b8bf7;color:var(--theme-ui-colors-text);background-color:var(--theme-ui-colors-background);}</style><style data-emotion="css-global 0"></style><div style="outline:none" tabindex="-1" id="gatsby-focus-wrapper"><style data-emotion="css sg0hsn">.css-sg0hsn{font-family:'Noto Sans KR';}</style><div class="siteRoot css-sg0hsn er8jt8f1"><div class="siteContent"><style data-emotion="css 101lz6j">.css-101lz6j{font-family:'Noto Sans KR';padding:0 1rem;line-height:60px;background:#2867cf;color:white;z-index:101;position:fixed;top:-100%;}.css-101lz6j:hover{-webkit-text-decoration:underline;text-decoration:underline;}.css-101lz6j:focus,.css-101lz6j:active,.css-101lz6j:hover{top:0;}</style><a href="#main" id="skip-navigation" class="css-101lz6j er8jt8f0">Skip to content</a><style data-emotion="css 135rxfn">.css-135rxfn{background:var(--theme-ui-colors-primary);width:100%;padding:1.5em 0;}</style><header class="css-135rxfn e1vkxza51"><style data-emotion="css g3texn">.css-g3texn{width:100%;max-width:1050px;margin:0 auto;padding:0 1.5em;}.css-g3texn ul{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;}.css-g3texn li{display:inline-block;margin-left:1em;}.css-g3texn li:first-of-type{position:relative;margin:0;-webkit-flex-basis:100%;-ms-flex-preferred-size:100%;flex-basis:100%;}.css-g3texn a{-webkit-text-decoration:none;text-decoration:none;color:DarkGray;font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;border-bottom:2px solid var(--theme-ui-colors-text);}.css-g3texn a:hover{color:white;}</style><nav class="css-g3texn e1vkxza50"><ul><li><a aria-current="page" class="" style="color:white" href="/">Home</a></li><li><a href="/about/">About</a></li><li><a href="/feed.xml">Subscribe</a></li></ul></nav></header><div id="main"><style data-emotion="css 12q3pxa">.css-12q3pxa{margin:0 auto auto;width:100%;max-width:1050px;padding:3em 1.5em 2em;-webkit-box-flex:1;-webkit-flex-grow:1;-ms-flex-positive:1;flex-grow:1;}</style><section class="css-12q3pxa e16x2jx90"><style data-emotion="css l26jln">.css-l26jln{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;margin:0 auto;}.css-l26jln::after{content:'';-webkit-flex:0 0 32%;-ms-flex:0 0 32%;flex:0 0 32%;}</style><ul class="css-l26jln edjm4kl0"><style data-emotion="css 15oufvl">.css-15oufvl{position:relative;border:1px solid var(--theme-ui-colors-secondary);border-radius:2px;margin:0 0 1em;width:100%;-webkit-transition:background 0.2s;transition:background 0.2s;}@media screen and (min-width: 35em){.css-15oufvl{-webkit-flex:0 0 100%;-ms-flex:0 0 100%;flex:0 0 100%;margin:0 0 2vw;}}@media screen and (min-width: 50em){.css-15oufvl{-webkit-flex:0 0 100%;-ms-flex:0 0 100%;flex:0 0 100%;}}.css-15oufvl:hover{background:var(--theme-ui-colors-tertiary);}.css-15oufvl a{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:column;-webkit-flex-flow:column;-ms-flex-flow:column;flex-flow:column;height:100%;width:100%;color:var(--theme-ui-colors-text);-webkit-text-decoration:none;text-decoration:none;}.css-15oufvl a .gatsby-image-wrapper{height:0;padding-bottom:60%;}@media screen and (min-width: 35em){.css-15oufvl a .gatsby-image-wrapper{padding-bottom:40%;}}</style><li class="css-15oufvl ew41f695"><a href="/llm-dataplatform/"><style data-emotion="css 1s0ao55">.css-1s0ao55{border-top-left-radius:1px;border-top-right-radius:1px;}</style><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><style data-emotion="css tmzo0n">.css-tmzo0n{font-size:1.5em;font-weight:600;line-height:1.3;text-transform:capitalize;margin:1rem 1rem 0.5rem;}</style><h2 class="css-tmzo0n ew41f693">AI를 통해 진화하는 데이터플랫폼 근황</h2><style data-emotion="css w9bdb">.css-w9bdb{margin:0 1rem 0.5rem;color:gray;}</style><h3 class="css-w9bdb ew41f692">January 21, 2024</h3><style data-emotion="css 1gf1qw8">.css-1gf1qw8{margin:0 1rem 1.5rem;color:gray;}</style><h4 class="css-1gf1qw8 ew41f691">4<!-- --> min read</h4><style data-emotion="css qdaqqm">.css-qdaqqm{margin:0 1rem 1rem;line-height:1.6;}</style><p class="css-qdaqqm ew41f690">생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
+} catch (e) {} })();</script><div id="___gatsby"><style data-emotion="css-global hms875">html{--theme-ui-colors-background:#ffffff;--theme-ui-colors-text:#121212;--theme-ui-colors-primary:#121212;--theme-ui-colors-secondary:#e9e9e9;--theme-ui-colors-tertiary:#f3f3f3;--theme-ui-colors-highlight:#5b8bf7;color:var(--theme-ui-colors-text);background-color:var(--theme-ui-colors-background);}</style><style data-emotion="css-global 0"></style><div style="outline:none" tabindex="-1" id="gatsby-focus-wrapper"><style data-emotion="css sg0hsn">.css-sg0hsn{font-family:'Noto Sans KR';}</style><div class="siteRoot css-sg0hsn er8jt8f1"><div class="siteContent"><style data-emotion="css 101lz6j">.css-101lz6j{font-family:'Noto Sans KR';padding:0 1rem;line-height:60px;background:#2867cf;color:white;z-index:101;position:fixed;top:-100%;}.css-101lz6j:hover{-webkit-text-decoration:underline;text-decoration:underline;}.css-101lz6j:focus,.css-101lz6j:active,.css-101lz6j:hover{top:0;}</style><a href="#main" id="skip-navigation" class="css-101lz6j er8jt8f0">Skip to content</a><style data-emotion="css 135rxfn">.css-135rxfn{background:var(--theme-ui-colors-primary);width:100%;padding:1.5em 0;}</style><header class="css-135rxfn e1vkxza51"><style data-emotion="css g3texn">.css-g3texn{width:100%;max-width:1050px;margin:0 auto;padding:0 1.5em;}.css-g3texn ul{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;}.css-g3texn li{display:inline-block;margin-left:1em;}.css-g3texn li:first-of-type{position:relative;margin:0;-webkit-flex-basis:100%;-ms-flex-preferred-size:100%;flex-basis:100%;}.css-g3texn a{-webkit-text-decoration:none;text-decoration:none;color:DarkGray;font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;border-bottom:2px solid var(--theme-ui-colors-text);}.css-g3texn a:hover{color:white;}</style><nav class="css-g3texn e1vkxza50"><ul><li><a aria-current="page" class="" style="color:white" href="/">Home</a></li><li><a href="/about/">About</a></li><li><a href="/feed.xml">Subscribe</a></li></ul></nav></header><div id="main"><style data-emotion="css 12q3pxa">.css-12q3pxa{margin:0 auto auto;width:100%;max-width:1050px;padding:3em 1.5em 2em;-webkit-box-flex:1;-webkit-flex-grow:1;-ms-flex-positive:1;flex-grow:1;}</style><section class="css-12q3pxa e16x2jx90"><style data-emotion="css l26jln">.css-l26jln{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;margin:0 auto;}.css-l26jln::after{content:'';-webkit-flex:0 0 32%;-ms-flex:0 0 32%;flex:0 0 32%;}</style><ul class="css-l26jln edjm4kl0"><style data-emotion="css 15oufvl">.css-15oufvl{position:relative;border:1px solid var(--theme-ui-colors-secondary);border-radius:2px;margin:0 0 1em;width:100%;-webkit-transition:background 0.2s;transition:background 0.2s;}@media screen and (min-width: 35em){.css-15oufvl{-webkit-flex:0 0 100%;-ms-flex:0 0 100%;flex:0 0 100%;margin:0 0 2vw;}}@media screen and (min-width: 50em){.css-15oufvl{-webkit-flex:0 0 100%;-ms-flex:0 0 100%;flex:0 0 100%;}}.css-15oufvl:hover{background:var(--theme-ui-colors-tertiary);}.css-15oufvl a{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:column;-webkit-flex-flow:column;-ms-flex-flow:column;flex-flow:column;height:100%;width:100%;color:var(--theme-ui-colors-text);-webkit-text-decoration:none;text-decoration:none;}.css-15oufvl a .gatsby-image-wrapper{height:0;padding-bottom:60%;}@media screen and (min-width: 35em){.css-15oufvl a .gatsby-image-wrapper{padding-bottom:40%;}}</style><li class="css-15oufvl ew41f695"><a href="/llm-dataplatform/"><style data-emotion="css 1s0ao55">.css-1s0ao55{border-top-left-radius:1px;border-top-right-radius:1px;}</style><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><style data-emotion="css tmzo0n">.css-tmzo0n{font-size:1.5em;font-weight:600;line-height:1.3;text-transform:capitalize;margin:1rem 1rem 0.5rem;}</style><h2 class="css-tmzo0n ew41f693">AI를 통해 변화하는 데이터플랫폼 근황</h2><style data-emotion="css w9bdb">.css-w9bdb{margin:0 1rem 0.5rem;color:gray;}</style><h3 class="css-w9bdb ew41f692">January 21, 2024</h3><style data-emotion="css 1gf1qw8">.css-1gf1qw8{margin:0 1rem 1.5rem;color:gray;}</style><h4 class="css-1gf1qw8 ew41f691">4<!-- --> min read</h4><style data-emotion="css qdaqqm">.css-qdaqqm{margin:0 1rem 1rem;line-height:1.6;}</style><p class="css-qdaqqm ew41f690">생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
 오늘은 데이터플랫폼 영역에서 AI…</p></a></li><style data-emotion="css fmdkoe">.css-fmdkoe{position:relative;border:1px solid var(--theme-ui-colors-secondary);border-radius:2px;margin:0 0 1em;width:100%;-webkit-transition:background 0.2s;transition:background 0.2s;}@media screen and (min-width: 35em){.css-fmdkoe{-webkit-flex:0 0 49%;-ms-flex:0 0 49%;flex:0 0 49%;margin:0 0 2vw;}}@media screen and (min-width: 50em){.css-fmdkoe{-webkit-flex:0 0 32%;-ms-flex:0 0 32%;flex:0 0 32%;}}.css-fmdkoe:hover{background:var(--theme-ui-colors-tertiary);}.css-fmdkoe a{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:column;-webkit-flex-flow:column;-ms-flex-flow:column;flex-flow:column;height:100%;width:100%;color:var(--theme-ui-colors-text);-webkit-text-decoration:none;text-decoration:none;}.css-fmdkoe a .gatsby-image-wrapper{height:0;padding-bottom:60%;}@media screen and (min-width: 35em){.css-fmdkoe a .gatsby-image-wrapper{padding-bottom:60%;}}</style><li class="css-fmdkoe ew41f695"><a href="/pandas-2-0-copy-on-write/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Pandas 2.0의 Copy-on-Write에 대하여</h2><h3 class="css-w9bdb ew41f692">December 24, 2023</h3><h4 class="css-1gf1qw8 ew41f691">7<!-- --> min read</h4><p class="css-qdaqqm ew41f690">Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/spark-on-kubernetes-scheduler-2/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Spark on Kubernetes: 커스텀 스케줄러 (2)</h2><h3 class="css-w9bdb ew41f692">December 10, 2023</h3><h4 class="css-1gf1qw8 ew41f691">5<!-- --> min read</h4><p class="css-qdaqqm ew41f690">Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/spark-on-kubernetes-scheduler/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Spark on Kubernetes: 커스텀 스케줄러 (1)</h2><h3 class="css-w9bdb ew41f692">June 08, 2023</h3><h4 class="css-1gf1qw8 ew41f691">3<!-- --> min read</h4><p class="css-qdaqqm ew41f690">Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/berlin/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1062&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAAMABQDASIAAhEBAxEB/8QAFwABAQEBAAAAAAAAAAAAAAAAAAIDBv/EABoQAAIDAQEAAAAAAAAAAAAAAAMRAAECEiH/xAAVAQEBAAAAAAAAAAAAAAAAAAABA//EABURAQEAAAAAAAAAAAAAAAAAAAAR/9oADAMBAAIRAxEAPwDlAjvdNSiD5p35M8m2PbxaVKSQuy296alalC1EiIF//9k=" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;q=50&amp;fm=webp 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;q=50&amp;fm=webp 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;q=50&amp;fm=webp 1400w" sizes="(min-width: 1400px) 1400px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1400px) 1400px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;fl=progressive&amp;q=50&amp;fm=jpg 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;fl=progressive&amp;q=50&amp;fm=jpg 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg 1400w" alt="cover-personal"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;q=50&amp;fm=webp 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;q=50&amp;fm=webp 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;q=50&amp;fm=webp 1400w" sizes="(min-width: 1400px) 1400px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1400px) 1400px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;fl=progressive&amp;q=50&amp;fm=jpg 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;fl=progressive&amp;q=50&amp;fm=jpg 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg 1400w" alt="cover-personal"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">베를린에서 2개월 살아남기</h2><h3 class="css-w9bdb ew41f692">May 10, 2023</h3><h4 class="css-1gf1qw8 ew41f691">3<!-- --> min read</h4><p class="css-qdaqqm ew41f690">우연히 회사에서 좋은 기회를 얻게 되어 독일에서…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/mlops-dmls-fsdl/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1062&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAAMABQDASIAAhEBAxEB/8QAFwABAQEBAAAAAAAAAAAAAAAAAAIDBv/EABoQAAIDAQEAAAAAAAAAAAAAAAMRAAECEiH/xAAVAQEBAAAAAAAAAAAAAAAAAAABA//EABURAQEAAAAAAAAAAAAAAAAAAAAR/9oADAMBAAIRAxEAPwDlAjvdNSiD5p35M8m2PbxaVKSQuy296alalC1EiIF//9k=" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;q=50&amp;fm=webp 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;q=50&amp;fm=webp 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;q=50&amp;fm=webp 1400w" sizes="(min-width: 1400px) 1400px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1400px) 1400px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;fl=progressive&amp;q=50&amp;fm=jpg 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;fl=progressive&amp;q=50&amp;fm=jpg 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg 1400w" alt="cover-personal"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;q=50&amp;fm=webp 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;q=50&amp;fm=webp 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;q=50&amp;fm=webp 1400w" sizes="(min-width: 1400px) 1400px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1400px) 1400px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&amp;h=207&amp;fl=progressive&amp;q=50&amp;fm=jpg 350w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&amp;h=413&amp;fl=progressive&amp;q=50&amp;fm=jpg 700w,https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&amp;h=826&amp;fl=progressive&amp;q=50&amp;fm=jpg 1400w" alt="cover-personal"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">MLOps 관련 책, 강의 리뷰 (DMLS, FSDL)</h2><h3 class="css-w9bdb ew41f692">September 13, 2022</h3><h4 class="css-1gf1qw8 ew41f691">1<!-- --> min read</h4><p class="css-qdaqqm ew41f690">MLOps…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/spark-on-kubernetes-spot-instance/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들</h2><h3 class="css-w9bdb ew41f692">July 23, 2022</h3><h4 class="css-1gf1qw8 ew41f691">3<!-- --> min read</h4><p class="css-qdaqqm ew41f690">스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…</p></a></li></ul></section><style data-emotion="css 122up9l">.css-122up9l{width:100%;margin:-1.5rem auto 2.5rem;max-width:1050px;padding:0 1.5rem;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;-webkit-align-items:baseline;-webkit-box-align:baseline;-ms-flex-align:baseline;align-items:baseline;}</style><div class="css-122up9l er8hy5f3"><style data-emotion="css 18kuraq">.css-18kuraq{border:1px solid var(--theme-ui-colors-secondary);border-radius:2px;display:inline-block;float:left;color:var(--theme-ui-colors-text);padding:1rem;background:white;position:relative;-webkit-transition:0.3s all;transition:0.3s all;}.css-18kuraq svg{fill:var(--theme-ui-colors-text);margin:0 0 0 0.25rem;-webkit-transition:0.3s all;transition:0.3s all;}.css-18kuraq:hover{background:var(--theme-ui-colors-tertiary);}@media (hover: none){.css-18kuraq{background:white!important;}}</style><div class="css-18kuraq er8hy5f1">1<!-- --> <style data-emotion="css 11hydmf">.css-11hydmf{font-size:1rem;background:none;border:none;cursor:pointer;position:absolute;width:100%;left:0;right:0;bottom:0;top:0;color:transparent;}.css-11hydmf option{color:black;}</style><select class="css-11hydmf er8hy5f0"><option selected="" value="">1</option><option value="2">2</option><option value="3">3</option><option value="4">4</option><option value="5">5</option><option value="6">6</option><option value="7">7</option><option value="8">8</option><option value="9">9</option><option value="10">10</option><option value="11">11</option><option value="12">12</option><option value="13">13</option><option value="14">14</option><option value="15">15</option><option value="16">16</option></select>/ <!-- -->16<!-- --> <style data-emotion="css 16zxbbs">.css-16zxbbs{padding:0;width:0.6rem;}</style><svg viewBox="0 0 292.362 292.362" class="css-16zxbbs e18bq5uy0"><path d="M286.935,69.377c-3.614-3.617-7.898-5.424-12.848-5.424H18.274c-4.952,0-9.233,1.807-12.85,5.424 C1.807,72.998,0,77.279,0,82.228c0,4.948,1.807,9.229,5.424,12.847l127.907,127.907c3.621,3.617,7.902,5.428,12.85,5.428 s9.233-1.811,12.847-5.428L286.935,95.074c3.613-3.617,5.427-7.898,5.427-12.847C292.362,77.279,290.548,72.998,286.935,69.377z"></path></svg></div><div><style data-emotion="css 1mg2dex">.css-1mg2dex{background:var(--theme-ui-colors-primary);color:white;padding:1rem;border-radius:2px;margin:0 0 0 0.5rem;cursor:pointer;-webkit-text-decoration:none;text-decoration:none;-webkit-transition:0.3s all;transition:0.3s all;}.css-1mg2dex:hover{background:var(--theme-ui-colors-highlight);}@media (hover: none){.css-1mg2dex{background:var(--theme-ui-colors-primary)!important;}}</style><a style="order:3" class="css-1mg2dex er8hy5f2" href="/2">Next <span>→</span></a></div></div></div></div><style data-emotion="css vdyr8l">.css-vdyr8l{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;-webkit-align-items:flex-start;-webkit-box-align:flex-start;-ms-flex-align:flex-start;align-items:flex-start;margin:0 auto;max-width:1050px;}</style><footer class="css-vdyr8l e12cejif2"><style data-emotion="css w1k8v7">.css-w1k8v7{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;-webkit-align-items:flex-start;-webkit-box-align:flex-start;-ms-flex-align:flex-start;align-items:flex-start;width:100%;border-top:1px solid var(--theme-ui-colors-secondary);padding:1em 0 2em;margin:0 1.5em;}</style><ul class="css-w1k8v7 e12cejif1"><style data-emotion="css 18gjhgp">.css-18gjhgp{display:inline-block;padding:0.25em 0;width:100%;}@media screen and (min-width: 35em){.css-18gjhgp{width:auto;}}.css-18gjhgp a{font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;color:var(--theme-ui-colors-text);}.css-18gjhgp a:hover{color:var(--theme-ui-colors-highlight);}.css-18gjhgp a:visited{color:var(--theme-ui-colors-text);}</style><li class="css-18gjhgp e12cejif0"><a href="https://www.contentful.com/" rel="nofollow noopener noreferrer" target="_blank"><img src="https://images.ctfassets.net/fo9twyrwpveg/44baP9Gtm8qE2Umm8CQwQk/c43325463d1cb5db2ef97fca0788ea55/PoweredByContentful_LightBackground.svg" style="width:100px" alt="Powered by Contentful"/></a></li><li class="css-18gjhgp e12cejif0">COPYRIGHT © 2020 by<!-- --> <a href="https://github.com/Swalloow" target="_blank" rel="noopener noreferrer">@swalloow</a></li></ul></footer><style data-emotion="css-global o2wd2y">html,body,div,span,applet,object,iframe,h1,h2,h3,h4,h5,h6,p,blockquote,pre,a,abbr,acronym,address,big,cite,code,del,dfn,em,img,ins,kbd,q,s,samp,small,strike,strong,sub,sup,tt,var,b,u,i,center,dl,dt,dd,ol,ul,li,fieldset,form,label,legend,table,caption,tbody,tfoot,thead,tr,th,td,article,aside,canvas,details,embed,figure,figcaption,footer,header,hgroup,menu,nav,output,ruby,section,summary,time,mark,audio,video{margin:0;padding:0;border:0;font-size:100%;font:inherit;vertical-align:baseline;}html,body{background:white;height:100%;}.siteRoot{height:100vh;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-flex-direction:column;-ms-flex-direction:column;flex-direction:column;}.siteContent{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-flex-direction:column;-ms-flex-direction:column;flex-direction:column;-webkit-flex:1 0 auto;-ms-flex:1 0 auto;flex:1 0 auto;}footer{width:100%;}article,aside,details,figcaption,figure,footer,header,hgroup,menu,nav,section{display:block;}@media screen and (min-width: 35em){html{margin-right:calc(-100vw + 100%);overflow-x:hidden;}}ol,ul,li{list-style:none;}blockquote,q{quotes:none;}blockquote::before,blockquote::after,q::before,q::after{content:'';content:none;}table{border-collapse:collapse;width:80%;border:1px solid #ccc;}th,td{border:1px solid #ccc;padding:10px;}th{background-color:#f2f2f2;}td{text-align:center;}*{box-sizing:border-box;}body{line-height:1;font-size:100%;font-variant-ligatures:none;text-rendering:optimizeLegibility;text-shadow:rgba(0, 0, 0, 0.01) 0 0 1px;font-weight:400;}img{display:block;width:100%;height:auto;}button,input,textarea,select{font-family:inherit;font-size:inherit;background:none;border:none;-webkit-appearance:none;-moz-appearance:none;-ms-appearance:none;appearance:none;border-radius:0;resize:none;}button:invalid,input:invalid,textarea:invalid,select:invalid{box-shadow:none;}button:focus,input:focus,textarea:focus,select:focus{outline:5px auto #5e9ed6;outline:5px auto -webkit-focus-ring-color;}body:not(.user-is-tabbing) button:focus,body:not(.user-is-tabbing) input:focus,body:not(.user-is-tabbing) select:focus,body:not(.user-is-tabbing) textarea:focus,body:not(.user-is-tabbing) a:focus{outline:none;}</style></div></div><div id="gatsby-announcer" style="position:absolute;top:0;width:1px;height:1px;padding:0;overflow:hidden;clip:rect(0, 0, 0, 0);white-space:nowrap;border:0" aria-live="assertive" aria-atomic="true"></div></div><script id="gatsby-script-loader">/*<![CDATA[*/window.pagePath="/";window.___webpackCompilationHash="3eacc184d38ef025e008";/*]]>*/</script><script id="gatsby-chunk-mapping">/*<![CDATA[*/window.___chunkMapping={"polyfill":["/polyfill-d094170835888e167009.js"],"app":["/app-ab1b2a0835a876cd6f2b.js"],"component---cache-caches-gatsby-plugin-offline-app-shell-js":["/component---cache-caches-gatsby-plugin-offline-app-shell-js-a5a38e197924689a49f0.js"],"component---src-pages-404-js":["/component---src-pages-404-js-4ac76ba22be2a98a7ead.js"],"component---src-pages-contact-js":["/component---src-pages-contact-js-b42a9daadcb3f6c5075a.js"],"component---src-templates-page-js":["/component---src-templates-page-js-52c8e087d25d19abffa2.js"],"component---src-templates-post-js":["/component---src-templates-post-js-7da875d0b1e34eafe98a.js"],"component---src-templates-posts-js":["/component---src-templates-posts-js-69f10c35d9ff045cba55.js"],"component---src-templates-tag-js":["/component---src-templates-tag-js-91981983ecde30bf3336.js"]};/*]]>*/</script><script src="/polyfill-d094170835888e167009.js" nomodule=""></script><script src="/app-ab1b2a0835a876cd6f2b.js" async=""></script><script src="/framework-bcc6f24e0b0ce4807ff0.js" async=""></script><script src="/webpack-runtime-ee8b5763a1fb567dc95c.js" async=""></script></body></html>
\ No newline at end of file
diff --git a/llm-dataplatform/index.html b/llm-dataplatform/index.html
index f5ccd50..82a0ca4 100644
--- a/llm-dataplatform/index.html
+++ b/llm-dataplatform/index.html
@@ -1,7 +1,7 @@
 <!DOCTYPE html><html lang="en"><head><meta charSet="utf-8"/><meta http-equiv="x-ua-compatible" content="ie=edge"/><meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no"/><meta name="generator" content="Gatsby 4.25.7"/><meta data-react-helmet="true" charSet="utf-8"/><meta data-react-helmet="true" name="viewport" content="width=device-width, initial-scale=1"/><meta data-react-helmet="true" name="image" content="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&amp;q=50"/><meta data-react-helmet="true" name="description" content="생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
-오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"/><meta data-react-helmet="true" property="og:title" content="AI를 통해 진화하는 데이터플랫폼 근황"/><meta data-react-helmet="true" property="og:image" content="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&amp;q=50"/><meta data-react-helmet="true" property="og:description" content="생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
-오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"/><meta data-react-helmet="true" name="twitter:card" content="summary_large_image"/><meta data-react-helmet="true" name="twitter:title" content="AI를 통해 진화하는 데이터플랫폼 근황"/><meta data-react-helmet="true" name="twitter:image" content="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&amp;q=50"/><meta data-react-helmet="true" name="twitter:description" content="생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
-오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"/><meta name="theme-color" content="#ffffff"/><style data-href="/styles.29ad1d7b30b2be092df6.css" data-identity="gatsby-global-css">code[class*=language-],pre[class*=language-]{word-wrap:normal;background:none;color:#000;font-family:Consolas,Monaco,Andale Mono,Ubuntu Mono,monospace;font-size:1em;-webkit-hyphens:none;hyphens:none;line-height:1.5;-o-tab-size:4;tab-size:4;text-align:left;text-shadow:0 1px #fff;white-space:pre;word-break:normal;word-spacing:normal}code[class*=language-] ::selection,code[class*=language-]::selection,pre[class*=language-] ::selection,pre[class*=language-]::selection{background:#b3d4fc;text-shadow:none}@media print{code[class*=language-],pre[class*=language-]{text-shadow:none}}pre[class*=language-]{margin:.5em 0;overflow:auto;padding:1em}:not(pre)>code[class*=language-],pre[class*=language-]{background:#f5f2f0}:not(pre)>code[class*=language-]{border-radius:.3em;padding:.1em;white-space:normal}.token.cdata,.token.comment,.token.doctype,.token.prolog{color:#708090}.token.punctuation{color:#999}.token.namespace{opacity:.7}.token.boolean,.token.constant,.token.deleted,.token.number,.token.property,.token.symbol,.token.tag{color:#905}.token.attr-name,.token.builtin,.token.char,.token.inserted,.token.selector,.token.string{color:#690}.language-css .token.string,.style .token.string,.token.entity,.token.operator,.token.url{background:hsla(0,0%,100%,.5);color:#9a6e3a}.token.atrule,.token.attr-value,.token.keyword{color:#07a}.token.class-name,.token.function{color:#dd4a68}.token.important,.token.regex,.token.variable{color:#e90}.token.bold,.token.important{font-weight:700}.token.italic{font-style:italic}.token.entity{cursor:help}@font-face{font-family:KaTeX_AMS;font-style:normal;font-weight:400;src:url(/static/KaTeX_AMS-Regular-d4531cf7ff335a5e1d2c2caa803e2592.woff2) format("woff2"),url(/static/KaTeX_AMS-Regular-b1489df1556f8c6612594025ccdca2b0.woff) format("woff"),url(/static/KaTeX_AMS-Regular-f80d9eaff7bad6dad7396a98fc016ce2.ttf) format("truetype")}@font-face{font-family:KaTeX_Caligraphic;font-style:normal;font-weight:700;src:url(/static/KaTeX_Caligraphic-Bold-f046a374a80bb69ba397ad705f607490.woff2) format("woff2"),url(/static/KaTeX_Caligraphic-Bold-7ce7636b90003f983253ab36004ed376.woff) format("woff"),url(/static/KaTeX_Caligraphic-Bold-0c96bc8fe7861c576cfee97fd1af3b2d.ttf) format("truetype")}@font-face{font-family:KaTeX_Caligraphic;font-style:normal;font-weight:400;src:url(/static/KaTeX_Caligraphic-Regular-4519ba4c9ee4f9b689505e396b96d93c.woff2) format("woff2"),url(/static/KaTeX_Caligraphic-Regular-4a559f36cc9a9ff50a2a5d8f8c7e5d07.woff) format("woff"),url(/static/KaTeX_Caligraphic-Regular-35f3c951b5a1044753e0eb4183d55103.ttf) format("truetype")}@font-face{font-family:KaTeX_Fraktur;font-style:normal;font-weight:700;src:url(/static/KaTeX_Fraktur-Bold-5b8749ee09f3aa84381365edac89c624.woff2) format("woff2"),url(/static/KaTeX_Fraktur-Bold-2ea3916b4309d29ba6938ff96202f3a8.woff) format("woff"),url(/static/KaTeX_Fraktur-Bold-069514d4061bbc045836eaec100359b9.ttf) format("truetype")}@font-face{font-family:KaTeX_Fraktur;font-style:normal;font-weight:400;src:url(/static/KaTeX_Fraktur-Regular-2c629b06891ec24911f53781b38554fa.woff2) format("woff2"),url(/static/KaTeX_Fraktur-Regular-0d90113d64d307cfb9e44a81546e7608.woff) format("woff"),url(/static/KaTeX_Fraktur-Regular-96556db6d8effe29a581028d82c1ac04.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:normal;font-weight:700;src:url(/static/KaTeX_Main-Bold-20b90c2076172b223ae564a9bb22e0fc.woff2) format("woff2"),url(/static/KaTeX_Main-Bold-a9cdbc850d2f94b8887ccf38fc6d6d85.woff) format("woff"),url(/static/KaTeX_Main-Bold-07e762d041b580e5d32ae14a9cb27450.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:italic;font-weight:700;src:url(/static/KaTeX_Main-BoldItalic-b345de5bd14864bcefbff8f92de7a1c8.woff2) format("woff2"),url(/static/KaTeX_Main-BoldItalic-7649d52f66dfd41d2cee9aaaa0019ccd.woff) format("woff"),url(/static/KaTeX_Main-BoldItalic-bc8d96e9689171ea65cb379f7967fb4a.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:italic;font-weight:400;src:url(/static/KaTeX_Main-Italic-ab751a9e86a16f178b79f99db42d3ea2.woff2) format("woff2"),url(/static/KaTeX_Main-Italic-e3954fe9b7efb3f438d218f6e8a8e049.woff) format("woff"),url(/static/KaTeX_Main-Italic-44a32ae60521190623e30c98de29ef17.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:normal;font-weight:400;src:url(/static/KaTeX_Main-Regular-13b3f8528a571d1cb797eb520002dde9.woff2) format("woff2"),url(/static/KaTeX_Main-Regular-9e75cd605a0f61540bc6894c330f1ef5.woff) format("woff"),url(/static/KaTeX_Main-Regular-af7fc7b32dbf2a640c9c26b2a0a7d050.ttf) format("truetype")}@font-face{font-family:KaTeX_Math;font-style:italic;font-weight:700;src:url(/static/KaTeX_Math-BoldItalic-d5d35e84b3ac1dbffd8fdc3dbea97849.woff2) format("woff2"),url(/static/KaTeX_Math-BoldItalic-94810ff68bb3c9cb6d3e9f3e73001b4e.woff) format("woff"),url(/static/KaTeX_Math-BoldItalic-4d6241be0cb599314b9ae4af29d68d38.ttf) format("truetype")}@font-face{font-family:KaTeX_Math;font-style:italic;font-weight:400;src:url(/static/KaTeX_Math-Italic-ffda88030bb30ae4a0f437dd9f86add2.woff2) format("woff2"),url(/static/KaTeX_Math-Italic-11278d3697e58b20e960ac9ee24ab338.woff) format("woff"),url(/static/KaTeX_Math-Italic-cae7ea2682cff6985955cd2cf261504e.ttf) format("truetype")}@font-face{font-family:"KaTeX_SansSerif";font-style:normal;font-weight:700;src:url(/static/KaTeX_SansSerif-Bold-5a20a4753af7a150824ce63096b7acc3.woff2) format("woff2"),url(/static/KaTeX_SansSerif-Bold-2946bdb590f9bd4c7ba30978a7eafa68.woff) format("woff"),url(/static/KaTeX_SansSerif-Bold-f0ad0abc489e2942f9e185a885d31e0a.ttf) format("truetype")}@font-face{font-family:"KaTeX_SansSerif";font-style:italic;font-weight:400;src:url(/static/KaTeX_SansSerif-Italic-e5fc2aef496040d3f44502045a9fa7f6.woff2) format("woff2"),url(/static/KaTeX_SansSerif-Italic-c834ba6da13819f078ec34f212d081e3.woff) format("woff"),url(/static/KaTeX_SansSerif-Italic-c7feacd514ed1bf5669a9a4ee68fe99b.ttf) format("truetype")}@font-face{font-family:"KaTeX_SansSerif";font-style:normal;font-weight:400;src:url(/static/KaTeX_SansSerif-Regular-5bf289005d5caccd361ab39e3a94f3b7.woff2) format("woff2"),url(/static/KaTeX_SansSerif-Regular-a4fd05630bcdec90cc1a744cc7462c35.woff) format("woff"),url(/static/KaTeX_SansSerif-Regular-5af9e1cfc966c7b16e7615fa66a29955.ttf) format("truetype")}@font-face{font-family:KaTeX_Script;font-style:normal;font-weight:400;src:url(/static/KaTeX_Script-Regular-a1c15978d325f10dcb49f0f8bd7055dd.woff2) format("woff2"),url(/static/KaTeX_Script-Regular-cd3b0634cbb3864a6105cbc61511f48c.woff) format("woff"),url(/static/KaTeX_Script-Regular-dd0db7aef0e4e809b61410ce74227665.ttf) format("truetype")}@font-face{font-family:KaTeX_Size1;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAABXYAA4AAAAAMqAAABWBAAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAhBoIDAmXFxEICrFYphYBNgIkA4FMC2gABCAFjWcHgxwMfxuCKyMRtoO0khFRObkZ/OXxxnDkpMkqiTL8upa1/onYf8by+VAum62LIrOdDjx/hMY+yf2DtvXv7S4LS5SCUQsYWAiIik2bd/adcQFGYtVlehk/Wy86vzPn/ciQIBu2uf1eVLelurcNVyXCYEF4HM7hUMRjVPUIB/D/aOtnRQme5oYHvjOIfdGsoZKgmbWipqjTVSeD9z/AOOz8vy8clvtXyKvCe50hNZHrTEhSl9PMoX8nsiOEqkkSnkz0cK9YpVse88r05j5y21TsUFRUiWPTw//pLNs/I+vteoK+IOqgC/ZMdao0zXhkKRqNzQeynLydJZZ9pAOyA/aGiDv7CL0bxqJD6LhPUUNRprx3RZWiK9OUKYt8DKvf9jMJdbeI524kpefVtnCbIM1SSIF7/LoTfxZAxDLcCBxAPBMnAGDk96HxAwyJgOf+FwH8IIVvv4M3UHzvrAcL9neS1KRZdaYUZ7EAG2aRvFOzEAC5E8FgCLAr8PTXS/kTQBoWJRArWoKZ5prveeIS8YQkWaVqk2qL6q7qvlqmDlRr1BFqnfq8RqC5E/VVDBFDxdA/TE4KsLQS1Kg4IKFKdotVn9HwtvgyBuC/P7PcE4+9bYP1vP/l/Gf8T/TBP08XP1301P7U9pQ7MTnxxO8TP024J4KfVL5vfRT7KOZRtDQR0FsT5kFSEOOgCECV3IjKXVC0nuvOLTJsdwqfwE7z70OwjQIcR0InJ6rDp7SoIU5ARRwn6ek/EN8+hX58iph2aNO8UqmIENr95wUD77nNnPdAFWC3UQ+IOTQgYJtVAwEtxJlXUP5Tr3XIPp6P33yO3rwrlaL4VfRYkhNmoM+cJlXq5m6BdmSA1If1tl4Azni0UlnT9YDPs2KzLDYfwMmQnMwJSQfa4xigWUu+3AYSGgtKu4Xg8KSPlABdRui8T2DTQMG8eS0q5xXEELGC/TiAe2+GTLzuUIUMb3Tdqr7bC8q/jvmV696kaMmVtbyNm+28MxxYXAMHcHmjByJGQFvcKE0AdHUQr1Xl730mOEkDF7K2hoDzf1TwEgCuJSfaTB5tl8VDzx0Dx+G6jzowC2YhyleWRTN9SVCaNS6apxYJS0NQUgdhd1jSNAWkWjfSdV4EclKEL2MotQch8+xt6gUj0hm9M5+u+wYRKtFyUt+NGsQAGwkhn+zCnR4JCRGISpGImnslENLYLFf/qOBdNE/EzCpucWoEqybF03exUp9Ruji7+dd+WDKl7XV8+vaScn5XfMaWo4Lk+N6SsELwGZBYtRZAaKjCKxL5waUJUl/ZWRSTUKNcWSP92cTbvAlFHRsQYarfvQkhp4hiWC2SszOTyVVWgBM2Aglk9ejw9mH7YK0izu8iEgkaI5AAXwB3UAafv6WLdTBzC8Vd5b0B9N9wF1KDLyr43GhQcIygxAT4YRL8MQUBmAOBmIYgzIVgzIMQzHijoRYsqxIDPyUW/k/oUKxRM1dRGApFLNuCChOgxiRoMAXhmAMRmIZIzIUozAMtZqy4CHvQQHx+RtpoaH0xzAvlaeLa7kejA/FGfNKQAGmqgrRYt2Xj2ZlndJxPZ0Kfp0XjkoSkcpxiHG8lTxOGBJWmazVC993mif5LSXdtLmhWlCa3gPIXvP14Rge2VY2OXm8wQXuauu0AdvgBNSShPbPXkMxDOXWE5/wpqESwvKS2uYCmwbselzVTIz2d4syNj8OR0Cc7qDh5vcEMQAmlp05bHYY3lkUn0l4x2w6QOl6tqhYoCcyucA97v+V1/EmcN7s61uM326cwFfbyqKIRcmySYUj2KTtPR5FRvwbBvDBIdovDIdiBSzI/i4oOqzMJytuk23IGjxMI/erGLjVrb9uGm4NnLuFoR4srd6F8YEKtCWrWJ7v5TFrpgbQsKFUncHwqHNvbGivpe4EnQdKEaWVFszPIuidGYpcF5bHVnnkHgV5FcGKfolWseLwIRzJWspGNAtlSz7FMR+LMkZ3n6aK+mjntyYKpTZ4zeRMVb2qrzpEb44bsA70awiJUmvXerQPMJt1rG5BqhVVY1VxaMe/yoNiim0nYGw17oxalaU8Q25IrHYPKOy7oUJPrxbQJmR9smrnrnm05X/YJPrlqO6NipgG7Jng70NkivqOcqKKXpnsYjtYJvdGUHJLcrrxBBeymSCrN+QNSvlCwNFCOTa0mRfNMV7pwUJcpCnp5UwY9PoCjoakYoYggoGKMUBICcKJSjFBGEFA5RqgIAVjRNIwwnSCgSoxQFQKwo2qMUEMQ0AyMMDME4EKzMMJsgoDcGMETArChWoxQRxBQPcbOhrjRtHjbjX9To1mb0oSyoTkNyg2yQEsiXQhaA+nQFkgX3i17QntDBnQEMqAzkAFdgQzobsiEnkAm9AYyoS+QOU1/3H6GIlZRS7HFjvIaRsnw4qGlZVXxgPBfDQAAiT+ocTEOwH0AYJ7gbT9SgBdAGAIP8xOAKL4RxImT8eAxROLozOzHk6V8lVJe2rakyE9LRb9CERMTEWkOCUCKa29NMmlYZIKODptWzgYKWAGf4bJikVSsiw6mNiMTcATUPYlwCcWqEWMLJMmCleHvO4GK+gJZFUin0HFfaopSphzGee17hxMLzDNiWGq9nMZggFph8KkcOCx9gcPGuql9/j3iVgji1osI0qOLyWs6RwoWRcID7+9gtPqU467PwyEqvoRYQQXjtR2uxjsxTlyCMQWSHMvamviOrOt7ThCaT9rdzgJJV+ejLPieJzgZlU9a3SmUIKcWEHVB2qQREiRHrGs7X/uYTqHirs/dAXs7OKHG2gEXY86KyXva65IdiVLEUWpZof9ChPpxn51+Qmz/pm2NYek/czxO6PG3bo+ynM4vj1ogdxGSId17x/g7o6FZC8Ku67CXL5dzWCzPVZrjUixnBad5SAErIhagElCfH3K/oIQD7rMNYEbDoZkucFsLTveiID1DWqwAqMQORIbsm0hkpMwpyOyccKqT7g8dPziFlzAIuY/dWQ7ItrHeFEmfX/1MbwbtaZqH324OMShD7LvwluVgGrgotiFC8DWAjp1qS13+Kq5UrjY1qPx/J+e4SiVcfXg1Rb2PFG/fiXaUNbD/U0sWSpxw/46PXRe8Lus491eWJ3q+dbGKIqYWJHlOX3KHk3ZgaVbNiEEsKpDpeQr1j+e4hNpfdqkZVIhsUdZWOG+Q4hDFdebJbiB7GkOItNTihO/scjD2xOoAL2lnn8Th44+B3KX3QNXHOc4V24H00FWZiP8KumYDD725Denha6BSdqB/D+X2DVvq0nr5b5J7NsZdWNq6YZvTwcd/sXbW2+r8Vq7+Be8TQvbKw9VAts2EMdsIMdm6Teva6lvRHIU0MehYBmQ+DrojTxW9GTBzhatAwk/6UDHNtV7ytThpZ2thaMvCkW6fRvXpz8iqOWovOe9b3/B+o5c5L4nIqg42Ikq2ZnqBKE+HqwSdUhM3u7HDU6RMRuUhabHBSkLjVXXIio+LXPjmrUyQqXMGQhcNptE8Wtt7hfHTmKsGtIRxsph1HdOji4gw2VE3CutjrtVaooxgkEZwfLG+n51MTp06rQbsGlG9rhoN7r5fiy21tZqsVolxYooZM6bXV3jn9EMXkCLL8K5IR0XhhSr2/lMlNKdIj9SzRlI3c3AvY7yP185XFx+n80Ce0xek2WHSWRgzksqMFLGgwhw/qW9KZZqHj/NwCS8H3PudmGcPveiT9PFjLb2oIUasm+Vzps49mijy8c5Spu6F0SMhdGd70mdwQfL4umoAbgDJHd5eegDAdHtlvgKEgCRmF9J7WAoh0sydvzq8M1z8auD2lTxMZR8hIZf6ye9GFICALvBbr7G3XVFnMI4ZeTv+vjhH3+UOriCp3e/tvsH3Lu+myIpghap10Pq/Lw8ndLtFol6u7+53zg8NU7nbl9cj60xrCvVxzRUwN/hEYPkic40IGA59dcZ7Z7Q7Z+/U0oyTf4MR1Zhvh+DeirhtMhrrYrRnaD8d9JNpFSJxvic486MueN4/Clr2gKs7323ZnyQUmQ5s+e6ODiFNeV4c5Q8vzP/E3R6iQILQ04S4QizvPl4Q/9aU5/dwpn9fUeC//7PqsJDAAs6e56e8VRB/vFtO05+UWDgckR74UH3B/5aXcqJHJu85wctO3eXzXR9l+l9FWnCFWIQa5/2JxErO7j2cgsCQ6rDP9teEZmv4SBlmhuo9peiRSWjlXprux8ULCcTogNwoHJmiUmwvWzzDBDbd+eRnLcYskSWJfsNuYdJtiTtPvk2Qr1wdtxozZOUrut9ItPCJ132c9lV52P3ajdWx1ftofbycqbmtBf3LE6xx+z3hhXnX/4z98/pOe0+7P866JJZOmQ1fvGgu14dBz3MtTDYXvfhs9cqvL8Syi7Y6VRbTDjh4KHbb8Z/iLM6co63Ht8V6d9iSHOzWRWzsha9XtpvT8I2XbZ5DcHCHxeRUnS6h6EXlv52DtSXRBnbPvgJSrM3Sip3k31GeLWPwHtIcG/m3cwNrU/eqVqFKK5WSdTcYHdtSu/ufKZ3xjeqN17Xtu9v3Knz1Ve5pn9Q20Hclq1BtP4GVSW3v4sOJD1vIjzrDzFXPndF+bX5j/DV4XVXCJTV4eLzGW+PFo/8f+Z8vpek/seG7xu8g7EcV0CqUqmilK3Voj922Fhqbo95/vf/gPyEM7ipIozfVZbFT0Y06uUzHZ1SxdJo9y55Gx6qY+4QJZn9UMvl7yyvdFHPCN3Qu9GxU+IbhHz+fK/MPSsS3RCcliwOumfw35Og2PCQ+5Hz8RKc8LvDf21TP+UKgjEs8IaxnlouOS5b4vLVF6PLe5O4NzZ04EKSkVU8YCNoHJ4ZTJlDK32/cssfwH78NHs9etvl7Xc+Vn4Df+X/F57VW4wWwTZW5g2rVYEBpKWv9hNQzFJM/nzI3eSyzkdtANCs4gko9fQh/Wumpr7eY/xj+akJEYON4RqFJl2C30WQQZb8UGBvnmuylyUBOjmQknEP/PtOUx3f/6dMsowk/X3Kr/OUA5VmfF24UfV70WQAlG5Qrz8o1Dc0JIxtldZppZ+nk8/ImufKeRrYlMuOdVkPK89HD/8jPKuWDMipgkS7T/GnyuaMQv1afenzrW+HNpT9o+zCAXvP+D0FhI4oMC1ew5NA7C4QWBphqV/w1T4Azp6KSGeJaMhQjYaHvefGdtmBRyXB5+aD96drCer4lGGx55ye7pCFvhtvBOhBXLhyeKZT5DJaXD4tKg8Uyt4INLIdmhisq8/Nr/YbrW+r8OuEnOEzb8TNZ6x/a2ytnrJY/3tOuRCjLv62lPzWt1FqWS5urY6tpv7JSHxl3QejCMEJTNa5MJqpRLlYvCOFt9Pyayjaaum+R+Yzmk65SI5Jxvjl077VK9VRJV7yyz+f0elNLxFTBTH5Uvaoswr1pkztiutpdW67mcvOmCHeS9bWqikilP8QPvfn6o092yxbFKvtWKE9flG1kHIx0VVXtjOYRv9+iU471h7w56jt39jda9q3Q8Csa9RuON/jm6v7u0jEkpU1MlWWrV3GQ6vN27uNZ+vqoOO4Wb0mqcH9MVdFQbnX2hqJS5no7tT/BLVukV25JTKYdQr989dKp6eNLli7FsKRnvMr20fY/DPGNOCqFfYyD+dDk3fHrGlR/L3MssJeiXsEs0T2WkyPBY+8RGvSGD+1cieOSevjQX7wa+OFQalZea1+FfMnmvKzU4bK5Qf7V2ywpqWlEfK1UXBtPpKWmWLZV8/Qbx990bBqsVzyviN+2Sxr6juLIkRi8GMVImKpdcZeG+rdK3q6NhkWwGU7K30sEnyw9SFMIxCZ2v5TER5ERBgkC4ROERCVB0RIRMaRCFk04yIElAiRCVGQkGEkoJaReVDsKcwUXZHs2kIvp7FBhcnk9B8I9fP3NGJGFS+f1Nrv1JFYMJIAgYixXoz93UqTPNtH5DtsyjOE+SApVLEJrdnJSgi5a1cec0WWF9kxj78GCFDVuLEFs0+yb8JQS8LyKProezpZk/MYTkF8CALy/bxfjrfa/G/+/yPEnSwGAhwAzqUxVCdXZ9a7GyYHinILdE/0NuyBewt/N+A476ZyasEFKegGu9XuUkQMtLhsricXkn3EcQPDfjX0+JPmIxB7o2iHDh9RRo5BSM8uCOfMldKYpsGk1uwnf11GitT7pokqry1T8Wowr+9vFHjRzTxw9JTsdzKfNc+MA3CDUC9zYqHvACQKxGKlBAGxlB1RNyiSmAkoMkYYESjQC1wyNpFGnUXys0DhEdpXTak2UEuFVTSwwjZdLzSgyi4RgljnjRfzF15AytmkEcbylkVxxVKNExqTGEZiJKKd9TRSNZLYmZsq9Ui71sWy+f/OQrou+tt2Ot2+N8KMNO6XIN1gVnUQMpqnMbEGzp+NOtwUFnvKGytn3C4oZnk3G7opE6dfsaWpgjTo9m8aOjMWHpWSG7fJ90ev0OhPac48LXVabwe9ibDK31TPElrv8WdFrMBbgbaOoJ4gsko7j8yDNm5nYypjd+Pz4czo+nzWma5lfY2jyXudjhLlleYXPRtAnGe9FZq49adARfVETIsG+Q7Hl2aa2lrCevjS+favxwx/0FV5LtetY5Coc8Q6BXacuw3q0aNKsD0urTjSWkZ5eqngBN8DkLIcGvXN4h5gtU5dQA69jvXFYee710+Eb2MbAhMy8wCs84Mia9aiH7nbDCiRUvvdKs5VpMafboFRDWlU/L48eLp069PV5jy4aTAkd8uuShoUaIj4+O0bzaaLooULpzOnp2hekidILKi5mcLkMg61unXaelG3WyvmQHNn6PyRLNPnFDMfaRld4ogUR8DjIDWrBJ1jiRC9dfIA11WMPalzWVB7tZ+pw2CXE+TpvVip7AXiZgBr54IV6YuxI7uWijj7UC/VB/aIeh2CRiQaQbJ7C5BbpmrOggcpCIIgrfthgYG0DYUnz3SyPgShaLpdQLW85S43wGM5ZlYh6+6ThHxPNvCvxBJLrVXd8VOZ9WehQJLxkP/ETFHEpnJshNE51simjeCIj+zNCQEguSzaLWdyJgPdhHEmkkIM0cpGHDOxGPuyCV1CAQtiLIhSjBKUoQzn6oC8qUIl+6I8BGIhBGIwhGIphyKIK1dz+jha93qrvP32i3sj0tXjrG94flSkYZ3pWrqenp3Owv4tx2YciROJkrXcYF+ZMrc883WjQ9zcxJqpJql11BJyb2PWqQTUqiVsl6s1qqmoN2DZy6LdKcZqV1K2ser1qUI2qCSfv5HS5HKpzdS4oeIUrpZVjiOurRpHvMPvjGNCHMYAY98C8ux0FACauToLjJRxXlVSOWlZVilCPIz3HeIsAsyO3rrxSl9+h2mMgnB3ByUatGyOWXU69AwAA) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABooAA4AAAAAMnQAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAAPSAAAAE4AAABgQ2JZAWNtYXAAAA+YAAAA7QAAAhobTaO1Y3Z0IAAAFnwAAAAKAAAADAAAAABmcGdtAAAQiAAABYwAAAuX1RTb8Gdhc3AAABogAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAAyXAAAYrO5FPkxoZWFkAAAOZAAAADYAAAA2E2h062hoZWEAAA8oAAAAHwAAACQGkwLaaG10eAAADpwAAACMAAAAzHYWCaVsb2NhAAAN/AAAAGgAAABoij+Qfm1heHAAAA3cAAAAIAAAACAA0Ax7bmFtZQAAFogAAALBAAAG50jJ4LVwb3N0AAAZTAAAANMAAAGcu8W4hHByZXAAABYUAAAAaAAAAH/i0Eg6eNrtWAV420q21jkzGskiW7IlOYljx3ZiO3HQWAxs4ZZxy11Ibm4vM0O/9rvpMjNT+xiWmZmZmZmZo74Z2c7zMvN6PkU0+c//n3PmjGYklCqSJL0RXYlIiqQ+j1GQcLJctat2sWrnK49erFTQXf5KBZ4lgfTY4Bz8G9knxSX2nBiByXKz5jSrnptQmB3zxTlfwMfefm2Kac98psZS197+k9fB1DwjVH99cO/gfm/UKWHzMCVxrDzHmuJYLseyBdZQApV8rlBvNBt2rFgo1hrVqufA1G3XmaaK2tOfrqFqmhzyDcE756ki66+FW+DW1+qySuaDd3DEZnAONY4Y5YgR4IjQqFY8l0kKC3El+JSqR0wIjlFm8jP8K9lsmBr5yemIONHTHOPNnNX9OYbCMUDiGHG76ub58eZXPparp88o/eRppZ+zpaGwleBGigWpWOBGfU9CjZtgNDgGwC8UCv8avFgzjQg9TdSoEfnJaeEDLzgnvb9tjYCwVudO54f3ylc+loyUfrK3RO/B+13KWX2M99vD+02EyhRhjLdirc5P/OCtUK81mqLVxFGv1cMb7sVKo1Kt+iJKTGHixJvie6K5Cd8TJ/gYM62hhcGoCkAhPp3RDEoNLTMd57egRotXOYBIGVpMHd2hy8AyhR1G9FjOkUHWd4yqwX8yvX/cyT4tWbxMA5jIWpQyw5RlamU5Zf0As4rJs+nEVJoBsxw0xlPWU5/ASplCD2UD430p9oSnWqlxA50uvbu43lLol2ZFeJU3P+EKvoJ0S5CQk3ATrsJE43EW6sPWvmqGjuLP+d9xzPOLq2RZNlfEGttGVXV0m9ESOrgwmGJA3Ol0ggHITu5Y1Dg+KFQm7k4VBgrZC1yonT3bEppZZRLbIeaqTEfk07LOeL/OLBMpS6QTPezxT2CpvvEBRjOTLZmVDCBBOyrB+R9iEWv4RcnjSs0wj3I0L8hWmw1O3aM+11gsDILPgh9BRIW4szX7IAIeizAKcnAen3STE0PQtJKzCx9DHVMGcp3ILcADOILvlooc2Q19GCamaNVKsyncx7MgTFrR8jlFEXa50blpUx6cWjskR9Zu0Ay9z7Tuss72ekprB2Wt9cTCp1SB+b0UahGuk3iaVpUVp+ueM1h+KxYl9bfQFnzld9S2/D48cD7o1ga/pbZA/6OIQwBJwggebVdNuVU1s3Y1bADlZ5fx6PK/iUPE4hreu4yHpQTnq4d8myKVXTGA7bwthiMfrLBFVnbcWzYWdpplc+eCIS/h7oh+0ySO0qFtRqDCD41tQ3QUR38O0RCIQ9yuSHZXgAncOrcAq9pAezrI94QfBmob5o4VcMFxNUd8Fx6ShkU9bnEUDhU0C2GlUXgd5GcmDLRIMyZoc+InVUr3PGU4Y5JhbfOcBmVjYEyWU0WjrG3YpA0TMzP8FLwgpkTOHUvqchlsOVdXn/98eJSRm2PqSNkILocr1EZWtqEs68ljLT7A+RwO+aQ6CjmdcEjzguwLyw2hVxASDIVoTzCGLgKgzW1uM9jTxXLThq/CFcHlHfvwqOc/X63nOvbPdVPNNkS9P8/ILfh1aZCzSVPORvb8qputVwWZrB3vuuM88vWsm+feIY6xwwpebW2OkeBKWLkmsc0WmbNKw8oTqrRUomUxg+0O9nRuykqZX2FPn9RleUjMuaHlX2GL0/h50z99RcccTAtzAI/o3AjbP2+Oc9hNFlaMg7SK2/4Ct91cqcONbNZPo8+HcejxbM71JN9TIFGttMtulRuXB8RwC0d5bQJr6wn8J/zHsOZrmEh48zPNE+ngW/clsBEYDR75vo9FL5u5ZrVmlqKrreBwcJgwAi88fvzFLwL8Kl7VN93PYM2hRFxBIMEGjLBgLwB1Bo7GsuX/GgFEhVD88JVXwvnzekx47OrgLPkpnz1SIpMVkTkVnhZSU9QIFxgyXhmKvCqE5yYocOJigAAVg0fpS2ueuAGUmMHhYk4Wenf86OtfB5rVdIctv+jW4KUP5N2Xf2pYvb1ruaWHnf+W9FK8XkpyS0rLP7wMxcLKU1+HhXW0UavVH04HZADi2AQAF6NRXH4qRqNaJFturtkwvWFNs5yNSBIKNHh8iDbFa8pArwL4KxCbv8nMx1vXtvNrTGq/ion4unk7LpAhaRPXNZPmurxKe7ZVEq0a2+hqlUbVExU3txJzUXJF704TRPnL/SOpJKiU6DTmx82kYUetWC/t2dKTxqg8MZ0KXxMatb3RhGFqViyhmX7/VG96S9p4eH8ibQABBA2NiFWYfMfL73yL+9CJGAOyftxLtV4jyKpR67/o3i9d+p/aBWPTSXPa7fMkFIrIy0JFD+C+vdfiTBr/WKoG/+K+gZvbb3Vqe471K/6ZkmjM/+M6NvWHBEUiIipysh2Vd0naC97yXyIy5I8YmX/GF27+C4261F8qschK/Toh3Szdh+fV0h3XX3LPyV+VV832ZBauF6axyY9fG1v+z62lE7+0UFEs+v9hjtdEjzxjLjdQFyg1/lnihongVjjKz+dBLEpkasIGX1V798tRmwJoKvzy6MQ11e/qiDozolo7Ut8DAIKj6yeHAOU3jA2ogCxGWKxQ//kYjr12GIkMua3JXDa5P4uUgiZvn5Z/uXdHH3YCI7xvNtfpax3Kz5QTbWdjHQCMnbXxjXFGUxv7yhfEKKN9Wx7kyoq1rfX9opAIfl1Ki1W5WFH7LX+25mPP8YUnW5/qSCSFzcd9QJhFvccz8eyePZh0+MXgpQ8KvszMH/XYjKjkkcR1aFD9wuc1aicdcgIm4WE//ZjidNsT30s9KObkWmgIGo6IazXMAIVhZ3lAxrFYaPqOZxHoWX/5qpEYmp6TxD17zqLlWrpCjUcN7R8GxNc6yTj96YefDpWn3TZKnKRNtc9/IahSW5W1FPzPpd+8EbVuBuOcgQVCcWjKjvHwcwKCTXuxYrfm8BrW28sUkZnkAdG+TATBeMEpOQIRQx0bW9h8UAOMZNI6orXqwM0bplfv1BE+NNDPYB3MqktPNwFA791y5FY1eGXwWtY/cAU8/XJz35oDmdRFc2bwsm5eY5xXbmVF6Ntx3+sMhmbNqYuHITPRQhe1uG/WYv06AYyevrsTv/nAKgvRTAmi2sHtF5YWi4vbBUmCn9X65OBlwcvNI7eZeGDNflNQyfSz4LXBK5XbjmxPalpy+5HbFJiFdcxq77m8iuyT5J/dc3nzD97R2nC5tbVTAmbYp3unxPZ+UAq3Seh9fgWO2LkphTg/ubX0S3FsjlP/XOkHwVvoffh+iwSwSpLgQrG26+CIdR1fSnVWc/PB2XCPKNHJaKj4CULijhvGGbHmOM0G3BjHU6dPn0LbZHjnqVN3okL2OUrwqeCTvH1KcQwF8pBWIQ15xRC4OznuTW1cox0fHhjHSSC28iQeJ7gT44bcAmSmHZogsw7oSvCx4NNq8OngY4rhKJCBAd4ykkTEVzxN87hn+JpqI6+Gd1lXGYwD4bzbqeh1ylm7jLVrYQNqK1nJEivLa5HEQ2JMtWoj3HBkV1Qdy934ynrBgFzh4fOH77lwYP4RhVyu8Ah8wQeeECl7pfu80gGwj97tQQPDzdGb/ttlQaKcHhwrbyzjW/KgJB5y2e6768XFu84/vJDPc4i7Li4cnH94cOA/PuuA7L/+YdpG7X4XXppkevpZdwwMD4wO53MjI5Ikd2kbkWrSeq4vOmvMzTTqE+PD2TjIv1mkH1Zs3pRsvJAv2tmwKNhZ0d3zoZm1eadfK/LrQPCSo4/yAG640lBluAG8R+57S/BAsLbWHrof3grBA+VHvunXCX3Di0Gbu/L5MlxDROfnX7nmp++HG+Rbj83u0eAqmUPZ7/hZtWPSGmmbdFio3b9jw/rKb6tWbs9gYh1dLECjWSgq7ehCscbCN2Lyq/GXxfYuYVgYfq0HYJMI8kW7raUzZ5aso0H6zNLSmcgmE8DchI+N5GdynXsr+O6ZdVt4n+sTk4nrj1q/zismyPY6TUBpG5YvFdDmkRt5Jtx4BL6ngwDtPLkheNrS2i1ntI0morlRk7Cr1h3k3/vbmznA37XexWvNamsLsSp86VZbDs3nxV/uVOHSuvDtb1kYz2VukRWVOT2afCtLetpsE4gfs3wCzVnN+x3LZtDotVdPa7rMSFybXk2NvqTOVq8hVjxukTWrmd5V7/vErpOYCWWmZDnrWKhJiLazdqx9SSK6u3x1UkEkmhYTE80IRjJZBT/UJ6suI09lFtPSLNgSbIEXwgtZP7+eEKtW/oNRafFnd8Km6lW3yo/F1u+37weS+C3ytlJ9RR/x7v8AozlAwgAAAQAAADMA0gAFAAAAAAACAAAAEAB3AAAAIAuXAAAAAAAAABYAFgAWABYAPABlAIcAmwC+ANIBSgG/Ab8B7AItAloCmwKyAtsDBANMA5MD0AQOBGkEngTFBQoFcwY+B2oIMAhoCKkI9QlBCVMJZQl3CYkJmQnFCfEKXwrWC2sL7QwgDDQMSAxWAAEAAAABAAC6weBlXw889QALA+gAAAAA2LKZCQAAAADYspkJ/cz+ogUYA1IAAAAIAAIAAAAAAAB42lXKIQjCQBSH8e+9La2zLFgvadgZtZgumwWLSXvPwpqwZC/2ng6rYE/2JAdD3w0nGH78Hx+PxAxAApBAImcz1RWNXIjfrXXNPiOBuvdLHQL9Dfp7UYloxzErKhaDK01WTvDFk4MEWnW08rA+t36iGe7ln9yiqcfVTrzt1oRygx/9/h1k7OADRvspE3jaY2BkYGAO+reIIYql7++Z/2WsEkARVGAMAJ6LBnIAeNpjYGJqYZzAwMrAwNTFtIeBgaEHQjM+YDBkZGJAAg0MDO8FGN68hfED0lxTGBwYFN7/Z1b4b8EQxRzEGKfAwNAfxwzXosDACAASxQ/yAAB42mNgYGCGYhkGRgYgYBQB8hjBfBaGH0DaikEByJICkpoM+gyxDNUMtQwLmI4x3WFmVhBTnKg4WfGi4mUlQSUpJWUlVSU9pcPK3MoX1F9qMWmxaLG9////PwMDUK8GUG80kl4mJL38UL3aSgeUOYB6X2gxgPX+BWp+/P/O/+v/1/zv/9/3P+ev+1+jv7z3f99rvNdwz/me0z32u//vfr/77e7Huwl3Ze5E3HC8pn1N65qmgDHQBxQARjYghrGZgAQTugJQkEEACyuYYiPBeHYOTrzyXAzcZDtdQoxBBsaWhFA8JGjn5YOxANbHSYoAAAB42qxV5ZrjyA4th5phGHxBnpr07ZuUPcxsx8nwNH6fa9Fu+r28+wx+GjnL//bR9shJc/dyQ1SlUklHR1KFlSFWq0lsiV79pKYXX3Fj+b2Eb7o8b9MtylcTrjSzn0fVqFpf12uu57GyrCLd6StHRWnos2OY0i2fK4Y2iH9Z4Nrce/15ZzyK1+Ol9xNPe26eEC8sJB4/tS7xXVndtZaKgVG2wfNQDXfEV+X8KizhLCGAyDPi8YUkhYbkbFxWt2V1O3VTa63LTttazWoh2bTW56oh+Kk1MwCqRwsJ13XIDR0CvmUn9blmNHDRRlFfC0lOBsHlk1Uar3O15UEfUU45fBdX602ktZikC262ZBNtcfp0OcGRi6S2I/tcNzwStfuqMqCmga0ONbHSYcaVtS121hGf6y2fRwwJyIlo/aeaWiPxwE9TKyZppwQ5avojEyqKw5a3Q/aY2U/+eOkFODT0yDilONcZbQyZUq6wyeQC5DZKrjZ11hmEmDjmOl/GLYVbR12aNGVC/Ynxapx4rvZsy/N5yhSVSswbWcfnaQNDIp6MXsp1LHRoeUp2S9hNYefzDNzMlpQQGFhHXJ6OUspT4mmQ5vOsebWSFLWNjr3MU5v6G59PmFeLyavlgdL1oD9V6k+aQs1Eq0kxMxOxk4U805YmReuGxaR8TOGDnbOakMdCUgh5yDbMcyrDtjyNa9trd3COK/gvNRaZ9IC/B+3+Uh1TwEKpUxpsRawe9x3HKWt1yqhCVeKVhGd0SDFP6JDHwW8aUorw38/OOmpahWGeFicbbf6y7V4CTaeR26m2z2dM4Yg8C55FnjNFVeR5U9REXjBFXeRFUzREuqYYEfkvU4yK/LcpxkT+31DAzoc+t8rFpz63y8VnPv/HKJ5q/wWM/wXG/8A3AaNIDxhFXgJGkRoYRV4GRpFNYBQ5B4wi/weMIueBUaQx9LBsNd8g7GxKkcY2knJAspF+Cwz7bfYxSVcMUY+OqYTO7mp5xn7TAq3k89Wd8jhn+UqrqDtn4uSqLRO8VjJz7PF1Q7dKvDdg58SHg2DCEPxovTr7nZKfzmN9t7junEFGN5E/9Y7ByyrK7vp8ywTnHvp8+/dM2YnWYX4HJVFnmxRQj5WWzn6R5z3d0xkla8ifHUz0bcc5cxrx7xqgwoDgrzThsai9mQea6GEOX/d2jykY+OCaDsWKOJV5f7qYfFuhKrnfVuaqF20ob+BoRLkurXUX04dqHkBLYGPw2FeidENzNco2FhJsMhfrVN6gg3cyTQg9p7uooUaELvKCKKOkdFQQLVE0TlJIrqOh6oe8wqNk1CxB4HNh8MrtxkLJ7wsHBE19bsiBfghqHogaueoQZ13dk2BSrYeiLxMYMqpWkoAeas+FZlsJZ7uUN5rYvdj77Tso1FEdPKyMljZ+NEQQbZcmla/ngylul/Kx0RQIa108zA9tUATOaQzgkx31wl710/3WR9o8M3y3faTT0PC9do7A0ixAe9gGZQk4gGm002Fgd6cFNVo90HeH7jp4NPCG/4VW7P1T3Sfws7uApfGE7Km3Z4cYYyFjO/+u5O/pIQH67v6Ue0j5zGA4+0rm8FTANzGLz4/RvzCFck6f4ltYvzR8B+KVsBaDV+rmQPFrj/WAHEEABFA0xj1STOcCsb22OWv7WIMLbv9R8XXVH9Pf7L9wO5p/yojY+p5RRBWHICb24QGIKw5BguZDkaQBKRqQpgEZmhdFlgbkaECeBhRo3hRFGlCiAWUaUKH5VFRpQI0G1GlAg+ZV0aQBLRrQpgGGmLfhae4wmI+qrqsnVY8zw/CsQ1/Mu7AeMLj1ELn1CLnpWMz7MJ0wuOkUuekMuelczIcwXTC46RK56Qq56Vqcy5Oj4Ofp9dq8MMzjq/gu+Kbc7AERbE1geNpj8N7BcCIoYiMjY1/kBsadHAwcDMkFGxnYnDYyMGhBaA4UeicDAwMnMouZwWWjCmNHYMQGh46IjcwpLhvVQLxdHA0MjCwOHckhESAlkUCwkYFHawfj/9YNLL0bmYC6WFNcAJhIJBt42mNAAgAADAABAAB42kzMtYFCYRAE4PntDncPsQYgxiF/ORFWChWgIW4VUAp1kOODbPStDYCI8EDgVRZACzhh0RL/aNIKKbRpjSD6tIEbU/rvZ+4WOaxpDxLiRPt+8v3PfAWh7QDm4kwLROSQlvDIA63QkEdaIyuvtEFCZei/n7lb9lSR9iBvVrTvJ9//yK/eWqOi1tSZIHqe8yvmsUJcE/GhlVKQrwiiVFpL6VvZrlOzbYwhu5q2v/6brl4xpXK9l8uy2cPJmXNmZ1flR2UXmacz06Jukly0u0ma0DU7uyhoZiwXhmMaFUZF38Vp70t8TuNMFzQwes7Lj7G+58enmf3k9I4X61xXw1Xhh6tqwdRVCfXpQNHeSX6gHrhydlVQohLVO9Jl/GObdHZZ17Vaap+96nclyVetk1rfFb4JpbfMtjiOauszumPH1Ybn9HUhutFLPryKiqL7zLrtz9nqxde6YhIit4YLJ2XrYs4V+YxpNprQtORiK55sBTH9unKqxE3M9rWkN9rm+jlnCp1oGg5uSft+lHlf9jsdZypbeqeczb9a7kyHk+N/8B9WKPGBChYLZPAgnMGgJWcXiawLtANKZROuwXBBW4AwgxHMgo18Y2FGAStEv3VO0ds7nws3Fo0OrgMYQXMwllI/Fnwv+BFPkmfxKTjFHVhc18ihJWEoWQV8OCvhOWSo0HEfdMSj3XQ5UfUAlq+DDZkkGSrs3h/OMj59msHnEnVYCktoePF/lfMdanfnK7T+4dSbiW87lT7UNJJjRKK0oS8KE3NhThuw6Gn/QoQbaKnmo6+ixCkSPhPGNSpngl4E1eEdxGGnyOU0YW5ul7YWPA/5FDriUD3CRM4pyqA9dJ40HGLQ91cOfcludNbMJWhsZFvhNZ7lK9zBTHRIHOA2YI8+IuG9rFJwR5aDCe9WwgtWIT3fT7mDqdRP/qbmf7W5WNkAAAB42mzBQQEBUQAA0Zm/AAAAgAicoQh0UQJcdaIMcN73CPy9j8yJswAkEJGnQI0VazbsOBh48DQyYdKUaTNmuZjjzN28BW4WLVm2YtWadRs2bdm2Y9eefQcOHTl24tTZp2a5NmAgimEA2oWHMQS74znCzDj+JyvVM0jtz/VAlFNSSbrvw3m9Wd0uy3gR4nF78Xzefp97N7m+/a49m5bnz33wH+M9NYTJFIUjWMIK1mZJkKFA6ytN4QzmsDArSk7qKbRcTgQZChzCcbRumgrWsPFEcFtwAAABAAH//wAP) format("woff"),url(/static/KaTeX_Size1-Regular-bbd9552cef932199b58e31fb907f8b18.ttf) format("truetype")}@font-face{font-family:KaTeX_Size2;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAABUQAA4AAAAAL6gAABS4AAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAg1oIDAmXFxEICq0opA0BNgIkA4EsC1gABCAFjWcHgkIMfxu/KRXsmC94HKBlnAHx/5cDeohagu27Bd+UDRYS4HoJ9Iy0jqKYlRsb40/dVFO9V45+vBidwLEdz2Gm4PgTf4CQaHIvyLYhf9sMFn8t9SMkmfXh+VP/3PsQonVe0CZ1UKRTzaTg5nYAOkkZ9CXO7N/PKXA2NaGeLIYKjGq9HwCyagD/j7Z+VpTgaW544DuD2BfNGioJmlkraoo6XXUyeP/DrhS2ytZ278UMmJp9mQ5irIsgMT+tHJIQUHAu1XIo8YgobOwDQa2sAmBY7l+hdXhviuy9mdpJkvAtnfmt9poLbE7WnYBUTQhM5XCtJCBW5f8/16e992XyIVtKkVNw7IE8KiBj3rxMcvLeG0pKmczCzAdKRWYRZv4CkC+QAs7f5QKxYrX1iBpIoxH/rKqskbpaVdcQO5xIu+77agxhGzkvromsLBKeLtS2DwGUySArwQF0MX0ZwNLktZPf4SIU4cizgJtqXLuOZ1I5KG8AMiHc7GbU7UUjV8m0CsCKVgZhZwEEGWYtwwt04GtJ9jqLC891LASwkEJADJLQgqmYjp30Xfozw1g0llBLouUtq8x+OZbGsrH8ze4JKAhwyI/apFOL6vBxltetYvv/sYDnv2V1/+Vn3zlqheWGPS947n6u+JX+8uSXK780/GL4Pv1b67eWb83qOBDAAMKDxjTUtCgAURmP5baASRROt0gswVkihQyGTgMDND1OI8hxcgol3qWMHEHgKY6T9PQfuvUp/MOnSPIKx1teqfgiVLv/Ylcnm9vMeQ/eAG3Uw8McGggQ4lUDhRbi9RIbPvUOL80Zz8dvPkdv3pV6UfkqejKTE97MJd63pIpX7hY4WKuASohTOJHh9YhWKou7E0h5JoVQLaQZkgqp+ZxmyUHs9Q3QzhK+4A0MNBasdgvB8VWEkwAvwXmfIHEDC/PmtahcGlSZks8SPojvMszJpx4HVYT/k+tWnZUo2PA65leue5OiJUEh8228hGuXJZz20Tkg4o0ekXWAd0StZALR0UHTlfPsHgnu1CCC9OxBxvk/1qUCEWTmhHV+Hq3WJ0YvaoHjcN3bGyQT2j8tZXT3xAwQVrPGxZpoYSwPK4PmEVAu00R0tKh1IykzIuPgYitE1NyAnLXpBeplTSYvemc+XfcNClQa5TGgGzUoAYkl5HyyTuIuCQlFAd6jgupCFYTaKhvUP9ZlxZqgZFZpF6QasDg1nr6Llc1H6WLVNoX9cDRky+v49O3Rdf5WdAfVoqLn3jsqcMeQJKCyBAjVUOUbVAwPmZpg9JWS2S8PyxbLYkkunLxV2tm0QwGa3MxLNCHnFIUlE1W81R0f3mmFO2EjCMFlTzw5v9Y6rNWi8C6ikqAxMglIBcRBGZL8VvfX0eU2lPaqrcYx/oa7kBr0qBjdaDBAQsBIKAQRBoIJCyGEg1DCQxgRQTgRQwSRRGOgFvLlSiz8KnHwd52OxBrH1EQTblFgKzATChbCgJWwYCMcRBEeookI7EQMDiJx4g32IIaEyow61tAYOfQIhR7xXe5TkwgSjIRTQxKkqZzRZN2WjWTdR/KdT0/O6aHVkylJp8p5wzjeSm3MuYxTG6PZDd1XmXuk83EnJ4CY/NpVTZj+Qvj0jA5sq7q94XpDMrSnqco+YLyHGlLQntlrSMUuQzivuIM0VOqml9RqCqRzdzwui6e2PK5OceZ8gkjoUz0xnLze4AWYwqqbWPFIeGNZEkXaK17FUdIvUMumCVYCYiDaF/k7zHwdf9KzTcH9pGEzNIVhMBRTxUrg2yTHNLk0iTwUpcb7GMq8MBh2i0ie3c51kYehqmT3qzMJNtik23KGmBOoIlPQfLM2woBbkmdYhtNuq4oXwIZGSdWjUbM50I0nzkkv9GjAlPqFXDCDb3tbGaXnIRBLkDRh8pjDRK8qsw2WUdeHx9hqz7yDli8hOKu7vBJTPf4AnPJVzU5sOUdITxa978zg9oX+linEq63tTb8PTMoM50/eRDKa2pro9Tcy9RlHezWNTILaaFecNcBrfKPZA9KtCCTrL/Mr3nUFLFsS1bmcTobB7oUl054is8WxlDuoYtGsDr2xV0w7IGsBG2IuvWdbzrv8Qp/UFHn2sE1A8i/0tqVVVVqNBenJ8un1WBSdE6mG5NNxKewoGlT4s0tKLxcPSENQsi5Mx6ZWk2JNTOWVDnqkS8mpomzQQyA/MBGQNYWFgKpTwEZApynsCRh0MjgSMGkKZwIWnRyuBGyawp2AQ6eIJwGXpvAm4NHJ4kvApyn8iXZwHj91Swsh7/60D4qIHZC8OyNgF+RcgwCURAPURENqK3YDvb4JRqIJZqIJVqIJdn0LnEQL3EQLvERrKB//70/086d19LM/b3yqGFvlpA8rfgLIcrBuUAEyLoH+NfQA+A8BSQvCkAJAtKAF0yIPJw0QnYI5NqIz4ARFY4lYlo0wKcUqcWVJkLOF0Y5e4RmbQ1Ub1OHhSS7eDwuOVN1BpFytVEZq1Rq9KzmNhU1xW4MH4gEZ7o9GSIJCyAJU4meBLZBk0S2+ywPpj6ktVIVxXac1kPyQIO1gxWNvhCr7KVtyk8vnQHWWV3g2kKeIyQsMUAeDERJp5s4wV+GS2tMF3EEQFyNIZoSQTZiSZWwCfk2cUxWPorqYCwUjr2AUG1+uMKZgyKobfEISCTwxwCf7CKF1KqndXJA+XfPvtRaoVyrp/gcDxlNef2Xzi8lqnFUyQF4EgnUvGK2plM7Hww/Gq6uf+cz48MaHOQvZgvaEKVlgM8JLbv5tMKyM8f4/qZyErtsfnst0sstfc42e8jEu69X31vdaXIqDD1cV55bSB7xH+rk5L4X7HNLJvgeMIcQx9nB8OY7hdEKOrOzUGIMGLLg0H9oYkBeMOGHBdWsQgheiykSc+oIq0ly6b0CzaJMpqnPPTcfXkylixx/b8lDI9rzVoJepJcMlHnt/FFEsvB2bJPnke+ag4o9vjeJ/pkLI3mOqKFvy1B0GIdcOw8bdcIu76eadj7+W/3z2Z1OVy2csnY8tPymi+P31ODd880Zc1lfKRUgvgOp55lxUIE1mJb67v/SBD8ontiEdLlNLcTmfw2b7UwV6yZv6B73hqYU3vzK6f/lPAqzYzucrXkFX/eSinF/m3b3ke248pi96MTFGjvQD6/wV42SrTq8t+cT4tsomJeO8J7i8PkZRdeQ8pNtuzCkyjr/Pq7NCmh6pZU9TW6iFGdkpDOcDScxatAcCLPw6rdfS+Lr7s4Qzr5w+6+//OQsB6cT7xPTbxf/Mo4hFtRCX81vWHFpGD0JIpxU+n7iQB+r9QIzyRD3S14XwasgmhJ7P86IJUKeAzQ4q8gJ3MEh0NKCAvcarK94SkPd33NHdDTbDaZetOteOw95e9dNPzE0cp5LZwfqBmGKuuuaQx2SFq/R94a/h0YlL+KZD+hoNPKBJYrZtmIrfCRGqn7LwgTqJVx8HjiG9pe24PeB8IFp1j/8hGQdk8+M5iLHNsRA6B8fiVYwe2PgOAGtBzWGQUarRGMAlrdxKMVFH6kDueB2o01QI9VD44L9MP7HsDp3vePyti3EsHPJJ8m9aPr3y7oE8dsloGwLV/wCHaZmY3aRFWx11QuZdGg8Ac655PpDXGKT3IATkuI7wSCZAiPQupNkcqBbyCmOo5IQDBpzPfcnebwFTq6XjIw6AcdeYxltz2lCZFpQTrQJCiAH2CZLP8V3U0Ryx/i53wC12zmR84QP9G5441nku/f6b5+Ua95dnwn0M+8nnD49eFsaISsdPsHVHHfvn4Sc8TR4jHqtQEGzxx68RhbK/GK9oqI5q8xPGb7SO1m7o0W+v8GULq4wyx7ffWWI0GKTw/ePmf1sIkeg/zxnwu854+NujgoPUMVbHtz+y0hsyeYOlYBiesCWe/xD/Y8Zb5vgUitOn+kSOdUrwKW6HFoww1w5xr04NTls9xG2uHVEYilu2dGzuTYm+tMl7cN9omdKnVNjGtP6b71Lmh+BWbAaWJYAY6zqzHNWrz27uHTGeIAHLMmJxM1SZn+/6t3WMTcGLxnWqclWKt7/5tTJVW5h36zLP5+QfLuiyyRW2rhdr/JnSBv7yrTxtYWXqr9+8rVD6lBKv+7QrtaJytYx8Lw8kZB5f9ueertHO+Py4FU4JPsFtfnVFZarrtNvLs43ku4LHNaV3D2Qyu+n//80wL7+XzdzJXj7D/N//dDefdE3jyJUOfbVJuB+ILq8If/uhUK1W2wtnuvyx8+PLkuTnsluEf2pvjQr76Uw93+fLJvYn0vmvJNucpq2dL029lSqdHlLiOH+/GY1lkf5Hli1uTRuwbECXoYZiGssQlFuXRVPz/QuF/0Mgz7x1xtzYmD7/U1PJHzbH8EKbesLInI/kNBG2KZ9OMhBG1UC+OqRZyBdpVlur+xb3ckT13JO+uR6N5ioR1UUHzduYWShJJCSrfuW73jLJMKWB77N2hkbDmv89Yxykketzkl/aGfeH/sECzbJR6T0/+6KGV/0VvfNFoIHf/3dcmdZtDX39Z0vy47DZsQ8bNPOCDTXGqoS57sp/RCZP7ywh4vXwoO7guDKrZYP5spZTPxIahQb7hxGrgje32WYS0wxDtm3kxU8zE/rkmMI/DwvqZvxPU53ZbCbF2va6pzC11AQxCV8kJZZGFSdk19i3ct6tYRnZnHSJb2bMgvi17qz+DkEs5Y6WJ5lLohoS8qpqErJ/H55JvUtVR/zmKXNEPm/qrqMjQmZqG/Wc7ew3mRUBf6Zf5y9zN5MIIbgrIXb+jIKu4OXDQ2aL3kKsfHy2qnmgvMAkzbq9SveKPvLHlJDcFSG1q6wfRuo/1osYR3iKUXfBFP6dNtwXZqQ8M3au7rjB9EFTiG1xyLi15HKE/hWdiBoFHdr3wiMuK7dJMcT8nghdZ43JJ1eqRtYWpbZvU9SXohoz32OEc5Z9Tubl1ySSlX99vbcoL2S4ffFp0UjJay8zzn2WcwLzHt6TBr25YsLMITzTtcK0X6s5SwLFRx+mJbEPUdoQXVK8fHVhp3ti/N8+2dbq7W0d+vlCUx8KtjF5rsmvx3w0CU+e5qxb5zUP/9QHpQf3MfAj7yoDx7eMDc1tXCiV/yoRnTpp79v6l893akZPiKQ3pKo9WarI8yM77+7OicTrTAJHTp02Sj6XqYfh3IUzZ5Rnzp67gGF8zFsnv07suXOOosP106BhPxSt2TcuamTGxTVTts55LyR5lO1UkPHTknXb13rtlO1z/Xk7PUk1J43zRk/t7LEnoql9R/nSgql3d29XaCIiNcMl7fEDE7fti+mIGzH2wF719JIJ+cHFjmyHy2x3rFez+d9pYVKxP5qbw+z0dH3A/lQU+WqZnOhWWjVspV2nI5SIGPm0qd/3K57Vqlm7qXT4/sVz+x9RL7MRH8xe2SlpjtPsGlguyy9TNfwOdPJR++Vz25aw/rrOzjfCxt5kl8xuiswnzOxZ/NS72W90e/nS1WvGsNQIrjenLyF1dR3aKhjf9xfzX5l9777/3nt5ZE4XoSmPJ5WuV2h6adYpppQ+jlL1qaa32jLms3nh6LCOjmHCnU6N6ei7JpFg6Oj0ywovh0f8UCjzd3YYBJHp3aMmTecdAbVFzHStoByImTDeNn6CuA3vc+r1BS2YOH3V/FXTMbGlgLmJI/7N/OgD/Dilri+PAWFqcfr+8JgFtANA2vOJ9A47A6M6ysDPCdXjWZ4loM6403JKgKLQeChEkxCFUaI0G9XE7DyDNFlFkFqYw0EYNqbo/bPjaiDQ4Pzp1XtkDjayo5+/MNI5ncuRxBwqCLuYQIkJs5qBb5Sj43xeRqLpdRiPyZSXFvXskZhgimQId7jW2oKs3u5Y01Bnyzw2Spl7Z7nm20lbwDMCAUCAWXM1sjZVr/tiGfM/AHx/apME7vKZ7tlu0ctcJQAxKEBEKZoooZH3ChpeTGOFE4YwDk9AY/OyBk/K1Icz24hWJg5e8j1+h5jWpaZbMBEYWgvzf/dTFdxnurZvMPsC1TK3F2mp6EgajzS2lzXwXjM7jTrYharxe06dLPTHKDvAz/0Hr43eROIBaMQASZTWXwGnA3QNakwEIMg2IAwwEmUzocrKGgQyVBkUIjQbDKzob7DQYb7BQYFNU/JVhoJ4sN9QIpT8MKVahKJxmGhkJf12k7tZg8BI1xkUSnrEYJBPLxosomm3wSGUiZqSXxsKOojJMJRI5vZNqV4TzXj/LAavtdn0k61FfsZlasKuNXMm9UdBVcXXqOIQVVhIyHjp1YEW6Mhfby9gk6HfLIu9TA/dfEfkiy6Nk1AHpEx+W6vUmk2bJ/FlRoqKTj+3pTLRnHDEpjcFCoqmby18O629RctVNo02KXovh03MsV9en7WJzWQeX/UijqFpTGa9/ecB2hMxx5uiFBxmyxfrN/GtX9TLbnWewheTn02eg1/q10HXkL0dIK+Ozbi0/gYN+i+1uVMruBkvKx/33cC0YkcWJQ9SbBpocinW8hlOxaAw5F10bgw80IY8Z0GYgxmsHI4x34kqYpUvZBIxxl4BcdGpx4sjHg99vR3kpJPe8+3OfA05Y9PwktxJSV6MxJVekTqwmUZ+PykQ+ZmQjhkUs0ji0awsmnNW5faMVbEZPnTiOmoFSYE8olLN/pe004avJjSjIk6FdhMK57kohrJqEowmXVPxAAzgwEkHhzXSu+UY1n04luISObVLzA8HFHj4QycDSFyDkjUdusA1+pJTQYJSkmdQmC1bsLHQJ2Q+9ZIJ5Ko7GimgLOVqiu4EFJiUu4rOaFOCWSQSWuztsqFXx1xEF241TljRZV3HrUGPElcgpxn6uk9sxkuy8x/CeepyZzdF+B368fnV7nS/T4nRfugHjNEEXOPb11a8adkut8fx+vw0tHT0DIyCBAsROscbsi5OZ5YzeeMep1syrmPYgIG/wCgrbHG7XU7Y0p2j5ibytsxxqi7VrXh28Di9arqapWTvkJbnTaH0y3I6QXWpbjWZpO6Rl5+fq+bdVT5KLuD96voAIcsbTpIfs48+KgA+OwDEwtHFl7kIQLKPZ5AbsJGFVfUnMxfWEzCAREcuiWeBsGzQv7YeizfMngOQx14g3Y9dFqCFATcgFwAAAA==) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABkkAA4AAAAAL4wAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAAOlAAAAE4AAABgRWJbumNtYXAAAA7kAAAAyQAAAdqK1xeEY3Z0IAAAFaQAAAAKAAAADAAAAABmcGdtAAAPsAAABYwAAAuX1RTb8Gdhc3AAABkcAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAAwCAAAWjK6904RoZWFkAAANwAAAADYAAAA2FFN06WhoZWEAAA50AAAAHwAAACQJfAGCaG10eAAADfgAAAB5AAAArH3JAgZsb2NhAAANaAAAAFgAAABYadFve21heHAAAA1IAAAAIAAAACAAyAxmbmFtZQAAFbAAAAK/AAAG50rK5LZwb3N0AAAYcAAAAKkAAAFCunBaJXByZXAAABU8AAAAaAAAAH/i0Eg6eNrlWAVg21gS1fwvsGXLtmxBwLEMiexwYll2aZOmFGjKzHhQ5i6Wl5nhmJnTHDMzM/My826s3khO2vSY73Y34tHov5k3k/l/zBAmzzDMF4nKUEZgfMM8CwzpaLZkS85aciZ/6+Z8nqjle/PwXgaYk+VzSSd7mIkz/FCQQEczKELGNLOmXShFS5amKgIv8JRXFT2qa6STj7/49sZCYfF34ryUSL4z5fOZv5fKRym/7NlbP/LLX3wMrGGesqFU7h7nmjkHDs5xFj4VYhAnUz4XXoM4CcSRXJxYoWhZmqa7CETIpE27WCrGinYhS7IIn/FJ0iiSFBIg+HvT50u9M5kIsnt9rIv1q59/zPnaMOuD0FPwrjkHD8yBffc0Jj2sCejTI4glIRbPuFjoDVMqut4wAj9XI9dQKmvlfZSiphbgf0BFoolP56iIX/8SLf0Cfi3g1+B9LVtqBo9f3nkS2RIE6+l1FuqVRlFCqOcHj7lMOmsyWbNo5XWNIY/oEQTYBxAOBHlKrilfVyWy/I+5QFikTzfiCJHyucyTo0gUXCQbA4RH5M47T7KzraeetvjXot65iJRBvXmo1+AhIV8uSWY7Mb1roVjCrZsUXBLdA521dFXh3eCFiaLixT0EQdd0xT1UHc+4aSrJ8JIUHDJYACCckN4isqy4JS1wBIAFdXXzZF8gxFOfafSGUURB32bxYvDlCbwFEu41TB8tH+LZ7v1y0zceCVSFl1hUqPJRa0m4OvBw/cSXhyjMmVitET4kcTSs53vFh5u6rw0BLJ9WTSnfdRAgdG1300OB3rweppw0zuMB9Lh+LFvyFYtVZczyinvomVK5uklU6CKlIrof9c6lUrZCUOXURs/lwpLU1bYgxoFgN9t+Sv3JmmUB4GIL2rokKcSzbJAtzBeBQLCtubE94N/bGvO71IA4v4DvWHZrmOM0o9SvPXS3MKPUXMVyQYljw0rPSuHuh7T+kqFxfMjvpyzRF1hB+JGU7zESMZbt7I0n5aavPyJYC3TCUj/DwKlniU3voyyjoZ8+Fv2keTSb1RU+49qbTQs8xixtcvDDZxrgMS5ADOPIxMfpoxOPGAYJkFV9i6W3AM34fenw9OnhtM+fQfYYsoneSR5g2nFUXXbzxcprHmdW3k0NpEXTdRzayyLcMojjISGkqwAdcm5mtmV1R9CcO/+cDsoTQjlf/bLL5rR3xu217WeL50/pIfcHguEUT+rUKjcrfP5ItLlVEmJni3KKysBIjNgMO95n+PM+j8T+Aadx3Cqy6dSpf8Xrct9/zmtmgtPFfo6+n2lA65Ke15plqSkbbSvJKTk27sl0bcvYKRUNZNOxS0UnIh6qoU4ATt8HqqvNksheI57QnC8tKRYH/ewHym8ov7FyuymeCISLxcXMONws4kYruH8eicqpP0V+dt8ZNHgI0QAeH/fkYo8HRBPewH5wHHrJ6eK2I/pkRM95Fa6YSukJomOoK1tDSmd0TQDFSpaK3mZhRLikNwG5QWOyBTQLsoUplKwkKydJyTDNCWhhbvdXO51vOT/1wTcIQPmh78Bb01cM3LRIVXJ0yqTym8tvwlBl0pf2gAjTbpjoPAH0JLnMGExzoUZEnSFRCJQv4wlbfhMQIVq/sbaVf8PLgRCBsNncHf3QTmDFF+bCjrAbv13lg3QEK1Lt2JwCed2dTDIZdIJ6SeSWm1gNlh96t0zKv44KcpBw9mvD0aQ/Wp2rL3xzsfPaIM8ejrJPD5YETvkoaYmqWV800dk0pdwGAjXhVFp0WRt5HX0PN5/pQixbcVlTBDeNNY+faKyLloqY27pSqXhY405nM26EjhXDbMFVe7NN2FiNFLLsePPKSzW9zTJShtVF6+J60qZUpOEoR5KpVC5Rvf5oUmtoaZ3a2k0StXqyXNscolQByXrm+FMkSqoXL7xkgVY1rbMulaxqDrHUR0Twr1r5lRtfXv5J2Tkyffek7hkd8VSSIa4P3Cc9Hw7hGmT/Ilsh/6If3P+GBBL57/NX9c/yTl3ehY+O8v5RRvzA0I0u9/Rf5/6FFDgYeW7E/F/PFa/OLGBezBzEXNm1ZePSvsQf5Uqs0gtgJbZKUVfwV6JHK8t5nhcyAjkrjNBFSq4Wytzlm57HARsKWV4IEcHCBxz1TKTbOuY0tLUld0wX/UubWq2sRX1/lvuOQbOtzdiJagtbW60z0fMJNTHC1be09QR5XpmrAaHV0HbEX+3K2WDV9DUSGRenb0O7OXn6ogWzOqfyLXD08lumFfzwpwRe5/zcnDRrwaLpnT18i3Pry2+ZUSGSvsM4uorTtPl5faq+zJJC8sXNl/bVX5c4vorjIy/ui1TmQdag7/dmD6XSZXnLEGCEUR6LTKnSNugaa8SVRIh1tjvbqJRQ6oDCZ0jQiIcIfI6AsyuWqOXZ657dxdbWKQLr5zS2uoo+8zuBMn8OaXTlDN74XnQQc7RRKdWqhsTDjXAbhOuUOBBnMpHidWHinEOBXhwzaoLPHmRvJjWJmECFZ35Hq2oop4r0NM4w04Y4YW8+rKzP3T0WwUBj5E05gukxGnb5tNDLIuLTCsEbdg9sCHEAQOPpWhZA/O0b+mftvMoHwNam4xQAqq4/SochsqT0qhV1i5yjzkRW1jWZhY/CJ8QbvleTO7lbdHqcGays6Sj9Anwx8Jlzt1R46PZ46DjdQRRd//HjCFo4mnJyBC+ekIx1EGO9Ao1MILVROV6xamDWjvFWBbKzb9p2boux9JWT1qtoP70u4lrlzHB6xqyCT8BHXasinDPRmRBYOXhdv8UFF3VvvaxuERyFLzCjneYpXFNwZzrNFHaavwTjvkqf2cJUukRod7XOdIkpOSNHwLC8HpH/7l8Yy3J7Vssb6ukW68+OhDope8RyflV+G/9dbDfdkXZj7xVArRrUUnnUKtmxaMljT1Cpu16OxVTNo4ruft8ranm/GAzBUG6dpg0NQVgMB2pf8VgI3g37Zwb8YVFw5m38bbHozHHmC4GwMhP2I8ZStMTtnXXECHrWpk2EiRUIGW2fEYNiUHaLERgaet8QgVAgIsAHhoc/AEL53IgowHtgCOAdcFIQZQmcXmd2yBlwekFiGIqr3m7uXZiddcwUZgAr28zuNkMGilk6ro2shBzdqK9UuFKRO13J3CZzXOdQtAtoGOC/ktd2Ztw8Jq9ItE0OnNj60x0D5tSbX/nF+t2ZIefuQXy45dWwLGC1a++99KLJiXl9j706WpeI7tzw4lc1tbzx8LnOnXau3rKyqXYfwfILofxLfnzzG/fv/vCFJ2o4ruobt1YeLpkFrL532xtWr3/1NRe9PkSI2Nr+pq279r0Z5MHe8nDOIvlsLp+tCzIMN87fRmYi08ssYcJTg4P9kye1tRoJGbi/5XhMzqCEuH6nwMxk5VTStk0Td/QaH1QV/faaKSikUnKFFNz+GgcPkRbzfSMGBzG4IcryEMMNpIs2HXPudO537nfvN1/yDnKt+8BvW4PsVAe5v0ZI+SaSZf0556lPJIJA6gmUfwSE+OihH81e9+xLSHbsYbNMGtx3YgsS1t2bOIufdqabmc9sdvlZu7i355x8k/F38IOJUckMFeeuUqngVu5sRaB4HWYRTGRQYHQvYWxUoJpp6mlGVbxBK3n0t1ImFvS9+ZLGZds+/elPNx53fuU4x/lcUm2ZJ9ZUscdp3A/Lt34ayKiwegf/hS9y4BwqRM6/LToleuuFEeuv5xNI6+Pschz9M2x8dflDwB6bUrB27XvVNbH6zDFyKIivnJExWfPIL/gvfZF3LgJiinMw/0JzRJNhyLjKuhlX9nOsekL+ieoKox+oqsu7Szq+RpZVZUzRtjNp784ueD9n2YV/oCLDZ9lqT3fLdhrRayVDsNQtwIXjdSEOtqiWYEi1eoRu3/JPlG7nNe4n+C3QWtmQBNi6NO6vqfHHl24FQTLkWoqo4+fi4p/MQXJqjBw1TrQ4yyuKqqLjqQYza08h5hS2WCjYE0Z9oPXopzdBCgbn2E4x4Ts955SvLF9FDpCDaLAmK0rvmvMO3XDpDYfOW9OrKIaAxNSeLXQjiH/Qwmwe/X2Yq/w+3GlbqoXH5srf368Hrh5qod7Y3OPquO/+AMfzgJUAAAABAAAAKwC9AAUAAAAAAAIAAAAQAHcAAAAgC5cAAAAAAAAAFgAWABYAFgBKAIAAnwCzANQA6AFhAdUB1QIAAk8CewLKAwYDRQOqA+AEQgT+BhQGyQb+BzIHggfUB+cH+ggMCB8IUQiBCPkJiQovCsQLEAskCzgLRgABAAAAAQAAf0Tz9V8PPPUACwPoAAAAANiymQkAAAAA2LKZCfwT/KIHvAVQAAAACAACAAAAAAAAeNpVyjEOAUEUxvH/zOyqJ9HolbbSvClcQYkD0NM5jNYRHEa5nT0Dgu9JRqL45f/y8nFnDhCWoJu44iLTNKOEK71qao4njs43aXg/0gDwHMukeVFce8b038cOaxbYqGDfe/MvZnrJv245yLq9Uaq6DR04dvABg04iLgAAAHjaY2BkYGAN+LOIIYrN4o/wvxr2PUARVKANAJIcBgUAeNpjYGK2Z5zAwMrAwNTFtIeBgaEHQjM+YDBkZGJAAg0MDO8FGN68hfED0lxTGBwYFN7/Z1b4b8EQxRrAHKfAwNAfxwzXosDACAD6LQ+wAAB42mNgYGCGYhkGRgYQuALkMYL5LAw7gLQWgwKQxQUkNRn0GWIZqhlqGRYwHWO6w8ysJKgkpaSndFiZW/2lFpMWixbb+////zMwANVqANVGI6llUuIHqtVWOqDMof5CiwGs9i9Q8eP/d/5f/7/mf///vv85f93/Gv3lvcd099fdV3cj74resLymfE3pmqKANtBFJABGNiCGsZmABBO6ApCXIYCFFUyxkWA8OwcnXnkuBm4GcoGwIIMojC0CoXhI0M7LB2MBAO5wM9cAAAB42qxV5ZrjyA4th5phGHxBnpr07ZuUPcxsx8nwNH6fa9Fu+r28+wx+GjnL//bR9shJc/dyQ1SlUklHR1KFlSFWq0lsiV79pKYXX3Fj+b2Eb7o8b9MtylcTrjSzn0fVqFpf12uu57GyrCLd6StHRWnos2OY0i2fK4Y2iH9Z4Nrce/15ZzyK1+Ol9xNPe26eEC8sJB4/tS7xXVndtZaKgVG2wfNQDXfEV+X8KizhLCGAyDPi8YUkhYbkbFxWt2V1O3VTa63LTttazWoh2bTW56oh+Kk1MwCqRwsJ13XIDR0CvmUn9blmNHDRRlFfC0lOBsHlk1Uar3O15UEfUU45fBdX602ktZikC262ZBNtcfp0OcGRi6S2I/tcNzwStfuqMqCmga0ONbHSYcaVtS121hGf6y2fRwwJyIlo/aeaWiPxwE9TKyZppwQ5avojEyqKw5a3Q/aY2U/+eOkFODT0yDilONcZbQyZUq6wyeQC5DZKrjZ11hmEmDjmOl/GLYVbR12aNGVC/Ynxapx4rvZsy/N5yhSVSswbWcfnaQNDIp6MXsp1LHRoeUp2S9hNYefzDNzMlpQQGFhHXJ6OUspT4mmQ5vOsebWSFLWNjr3MU5v6G59PmFeLyavlgdL1oD9V6k+aQs1Eq0kxMxOxk4U805YmReuGxaR8TOGDnbOakMdCUgh5yDbMcyrDtjyNa9trd3COK/gvNRaZ9IC/B+3+Uh1TwEKpUxpsRawe9x3HKWt1yqhCVeKVhGd0SDFP6JDHwW8aUorw38/OOmpahWGeFicbbf6y7V4CTaeR26m2z2dM4Yg8C55FnjNFVeR5U9REXjBFXeRFUzREuqYYEfkvU4yK/LcpxkT+31DAzoc+t8rFpz63y8VnPv/HKJ5q/wWM/wXG/8A3AaNIDxhFXgJGkRoYRV4GRpFNYBQ5B4wi/weMIueBUaQx9LBsNd8g7GxKkcY2knJAspF+Cwz7bfYxSVcMUY+OqYTO7mp5xn7TAq3k89Wd8jhn+UqrqDtn4uSqLRO8VjJz7PF1Q7dKvDdg58SHg2DCEPxovTr7nZKfzmN9t7junEFGN5E/9Y7ByyrK7vp8ywTnHvp8+/dM2YnWYX4HJVFnmxRQj5WWzn6R5z3d0xkla8ifHUz0bcc5cxrx7xqgwoDgrzThsai9mQea6GEOX/d2jykY+OCaDsWKOJV5f7qYfFuhKrnfVuaqF20ob+BoRLkurXUX04dqHkBLYGPw2FeidENzNco2FhJsMhfrVN6gg3cyTQg9p7uooUaELvKCKKOkdFQQLVE0TlJIrqOh6oe8wqNk1CxB4HNh8MrtxkLJ7wsHBE19bsiBfghqHogaueoQZ13dk2BSrYeiLxMYMqpWkoAeas+FZlsJZ7uUN5rYvdj77Tso1FEdPKyMljZ+NEQQbZcmla/ngylul/Kx0RQIa108zA9tUATOaQzgkx31wl710/3WR9o8M3y3faTT0PC9do7A0ixAe9gGZQk4gGm002Fgd6cFNVo90HeH7jp4NPCG/4VW7P1T3Sfws7uApfGE7Km3Z4cYYyFjO/+u5O/pIQH67v6Ue0j5zGA4+0rm8FTANzGLz4/RvzCFck6f4ltYvzR8B+KVsBaDV+rmQPFrj/WAHEEABFA0xj1STOcCsb22OWv7WIMLbv9R8XXVH9Pf7L9wO5p/yojY+p5RRBWHICb24QGIKw5BguZDkaQBKRqQpgEZmhdFlgbkaECeBhRo3hRFGlCiAWUaUKH5VFRpQI0G1GlAg+ZV0aQBLRrQpgGGmLfhae4wmI+qrqsnVY8zw/CsQ1/Mu7AeMLj1ELn1CLnpWMz7MJ0wuOkUuekMuelczIcwXTC46RK56Qq56Vqcy5Oj4Ofp9dq8MMzjq/gu+Kbc7AERbE1geNpj8N7BcCIoYiMjY1/kBsadHAwcDMkFGxnYnDYyMGhBaA4UeicDAwMnMouZwWWjCmNHYMQGh46IjcwpLhvVQLxdHA0MjCwOHckhESAlkUCwkYFHawfj/9YNLL0bmYC6WFNcAJhIJBt42mNAAgAADAABAAB42kzMtYFCYRAE4PntDncPsQYgxiF/ORFWChWgIW4VUAp1kOODbPStDYCI8EDgVRZACzhh0RL/aNIKKbRpjSD6tIEbU/rvZ+4WOaxpDxLiRPt+8v3PfAWh7QDm4kwLROSQlvDIA63QkEdaIyuvtEFCZei/n7lb9lSR9iBvVrTvJ9//yK/eWqOK5ciBGPrO/grdljxtWA4zM99SHY8y7sRUdg9+/SodpuUyvZIftKSyGtamk1p6m7yjOAy/t+IwCmmBG9MpaD8xXCTs02qRKO8pOfp0Rf5G66kuaDbRbc6H6/qAT073zYjjPe50M10vlYVdKusOU6xCGqMHjNYN5YXSEdeNKQsKVag+vXJK/8Vj0tuJfr+vcm3TCz1Qkjz17reOfiO8lJK+rlyLfa9vbEp73HDd4zZdNURbOueHrSjPO0hNc/1zvzy3fV0zSSEzCReNyLpFm2uyKdP+6gZtV1xckzeuCT7dthypSInZvZZ0T5tMn2VM7iSalmZ3SdsxL7W2GguCJqlNZRvVmOzqyMH20sbrfzCPEhWGqGHQQQoLwlskeCffGKFc39FyKJKHsABG47gFCPtIBLPgRN6+VFYdVvB+6Rzh053zN6mtC0c711kkgtpg5KJfF3wg+ASnkmcwEhxjDyyuXWTQkrAkWQWs+9ZSZ5eh3InHQK94tB67/CbrCCxvmYHLJMlQ7vn0h7P0f3+azmcCfXcp5NCw4n8h3wHUTc9TePcfp/448fKGpR9yHiX78IRp3LnITaxxc+qBhU93GyJsQYuaX92KEidP6qlUmkfKfUHngvpuD+Jww8jkm7i5NTdpXcFtl0/uROzUq9iQ7zYqx33ovPHIwQc923IE5R53shdzCRo9eYzUNc7kLbUHM9EucRa7DluMwZO6lasSHMjVIHF7q2AFK5ee3U05wLboN/5G8wPUoVjhAHjabME3AYMAAADB//Teu4Vs2ZNghOIFE7QVT6AGDHDHCAC6lA9D3oCMGLNmw4kffwIiEkc0tI6dUDglp6Zy5tyFS1eu3bh1596DR0+evXj15t2HT1/zviW5NkAAhoIAWrPNF7SL74G7w/zRq97J/3EmstRVksnvfNvtt8/7pi0iTEPxMMA49AQZCtSu0hKuoIWuu4hLOH5LBBkKnMJ5M6YUYISpAMYdQXoAAAAAAQAB//8ADw==) format("woff"),url(/static/KaTeX_Size2-Regular-d1e8ff17527d885764046b575c601f0a.ttf) format("truetype")}@font-face{font-family:KaTeX_Size3;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAAA6QAA4AAAAAH9QAAA45AAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAgyoIDAmXFxEICo9sjCIBNgIkA2wLOAAEIAWNZweBOgx/G9wcIwM1cpLygPzVAU9E7KH/ABI8lwixYgQOkSq8jpPrfIt+4YeKd9P56rNV5+O9xBGSzPrP02b+uW+EYQSGMMgSd4iYL4SY1YWskdbJrkcqZtn2i0mSijvEP97uv200Hg4kwcQSizVLLZDiH/4fbf2sKMHT3PDAN4PYl8GyBv6dBM3sl6KmqKerTga3zKY7tgOEqz3DTVGHRt8H4VF90pT5vzklMOrLQnIlxAtxAe3QyeRNbf83V2X//+mhWpUlkFkET2BJARlTXZ3ql0pNBhDTi9A9C4QKUJEjOABSwPIUuxX2hDplTsizbUgklYt9bLlTT3iLsamrNEC+uGfJ8m2AsfvpMASARdjPAewP3ZheRnExdKOGgY90vP8BPs3Aia0LaEDSF+WSomvGhPu440nAoSkO3dJJCAA31HFxE7hD09rkcdXnkUDHwYIk2QpNYhf24Bb2R/Y8x6V4UpXMdz6KvoD8JFmM0ceR1UuZb3/0w/iHee357QcOHTz9h/YfvD9oL3z1gvx0gR4LwqyURJAlEdsum/UEOJi8gNMEEbNZNklmzHUZCpjNTIKKaWkW/EpdFlDgKU2z9OYflu/eID58SpQckPVWTtQHEiy6/5LNWnNoC+c9eAOyyQCYSgwQSSpPAow6Er/egk+fhizImh5Odz4nb971I2JgK3kashMV4aaKt6w6L++OyArKOGdQkVtEC7/26UR9pHNAViXmJqW6cpjKoOwXUHLODso5G7hNxzkHOGoq+OiOhKCthOAR0aPzPkNlgKd58zqqQh11sNWLcR4oVzncxGe+FKlP+n9kOdeiqXT4tJ3Klut2crLsRcNugrLLltTN+5oCMenWgB44IDom+XJMwGMHq0+gBioRJgETpalQdPiPt1oyKmgomSizTMx8ksTBtGCaxpsebjBvDH+yLOeVKRsQfBRN+9RKR1hl4ADPVpIOaECIz6qwbqJkZxQB6aTVIWIuQBVZ+pIGZb5fJO/M55s+oLGyXsFCNwlYCJUSql7Pg7DBY0aL4z1qiwesFDooT9U/3po+tcKion5GiFPAnqrzzV6qfDvJl9E6+xEDW9V2erO7TXd+Gfa+Y1ixon3H+n0+VEWsOQPBIlZ1gdrToW0TXGylSqYCL4V9RIqXmXiDqliyowAWtKGDP6NqjtaC8SjOaosLX7LCTtkEErgYCNj/AuxcqugVewmrR01RPCI7KKMKVP3WV5exbDexn6kx07lccMtdygGDFRu3Ag5WCoGTGLiIAzfxsIME8JAIsWSCOJIgnsz+bKqBvoaRA79GLvzd1AlcQstWYiIeY5KYQTIxSCEOUomHNBIgnUTIIBNkkgRZZHbyGrRQQn5kQS81toDwqOpQBnkl7oUpIPmZ/EmgkNJcvqiwbs2uyNpOs5zzOVDkoAfTNoWTKmBrmu7kLKYWYxOboNJLPbRY+ZgHoEJNAZTVx06pwPYvdC/O5KmtVS8cNwMlVKu5xXlA+jcKlLI51wbKiMshHRZ8a+WszLavqNEceITFqz4yt7l1SgvnM+RxKANtnb4ZqCDYhg/4ILo7Zt067gtcavsKwmiVWWqkVMB7pCsQM5f4FRu20092uprkvi+RVj05RhOS1KfS59ms6PEEs1dcE9lX93dhKkcGp+5Ig25657pbroWicr2hziT4ZLNuzRmSZrAAIT0HLFq41irLqYLKEaKzUckK4FOedJiRGMW+nttAW0UOVKEwiCSElGftWsKoHgrJo6SZUCf85dakhLIgMX0SHlOj1ryDTT5KCKCni+Fv8+r213ZVzDIsfeN6QfZqbUiRc9xyAx01k2FnNtTR1OB219lOUpubWgDjViKhfoyt7TTQx6a6fOOIiizW3zSiMvdJMVFcDtRXzCPg1VBATm0uY5RkISwztVJvTWBZy6hKnN0dC+N/Yl7+RAbENcyFra057/Fsn610W+EII0Bt2d6W+7G1TGN78tbFM2PAJdE5lUksmYxPR13nqAJuOqW9vGtEOYDux2F7amo061MrpDJ6RgUynW4nonc0wCYT+wjQz8hwgACDJmyKQwTYycjQT4CACXuBwwQIMjIcIcCoCRvjGAHGGRlOEGDShM1wigDTjAxnCDBrwiLOEWCekeECoRbEEmYUaJeLpptJbPCYAiHjxtliGsTUGD1IgRjIgZhWZuIEakIctEAc9EAcjEAcNgkJ2AYSsAskYB9ILHMgfl95dvfpMVmn+XKCyaVtnW9V7kO+bxAoGoUVHYuVWKbeA0y08H2oTYzT8zAYtkfLaQOE7O7E84lxTsktDXQYGSc9QZT2Ljf/U1IEhR9WODkUNmTnfUNvTm3RUvClk/6X61JWETb+/zy7JPBMYHX+yhOX1hXFce/gG5ObCPufX/h3liFH1uhXwbdCketoybX+nX7TyvK9xjUj///a/7WxEtqlQQ4pCIVX5IhzbXHr2+FnaWldWXWshja/CTyzi7SQSsqukCE7t7aGr7tt7NmQs0bmtLutu/61czu4Pv7c7bHA51IcCBvnbk9l/d9/zS0jT9/i/v92Vt6nGUb65mbg2ltHw9jcsYodeW/lKlbx3T8NDjvRGUWRgZ+kr64iXJH255pKz5AQsj6NiO24Tvl28PqX1v3ur/5ZdWbG1vB1L3oM+TebWnktGJx9RQm73ZEP5cjMy7LnuumEpe3M7eCflGXHZmCzdUNZDt6txIf9//evRJxbw1ttx+WI/45F3glffOnQ2rfOpaKVewxjzekMBkNLqPpWHeGvjRWGOGSoIeTS5F2gQglpWCymUpCmX0L/2cDE8+HJSYTviTjXpkIRSvmXpl6kJdf1+XTH6s13pLFCpECxG4Xer3etOeaLvY96pdz/PcAFEn3b+0v9BdVi/4Xni4MFVd7H3b/tSwxw/P2//cvPG5dr66OfT3vt/fvF+7/dcfXV0nkWK8eIVeLg+ReIAwXVPwurdV76sKoncZ8o2DeUV2SessreSY/p1lWSBw/uTRi0f+Yf+zjGp/hOFa3nbcA8rdX9C9Jr/6oTa393nRKVraf68pwUZHL6bY8tS+oP6m9GJq63clDExul1Gu/nK2bc/nAgYXM6M7Tb1tUiQ9doVnpnwy1pxzlmuLznvSyXtqhDZjRCn/trvOb3/i8TAlbdxo4VH5vqsE/6TNBZlRZLy8JFfdnJG/P6JZI/+4zd1vYWBZaibvy9iDH75FRHxU+e2XRRKr0ioVUVLG9MZl68aOscVmFF/dYvOCnQvTifrsmir+mGm5o6LBPxaIBVHbZ1Xrw4mfmGRd8pm0Rz6VyRvjroXgadZ1X7fA2n9x76uqLypzOe20Dn4uHZn9amXeTGjp7i/0nOT3JP3Xmqn8jrFX53Oc8tNM01cV6vKM8e5mYTS67IOceSWVn9SI9pb9rojvU/lt/+RX8bd1g4P+XekoPKI2OP9Ijh9KvdlVvnE8cuGRc7Of/70z56dG75+XkufULXnmDgPjtVKW3zn/T37lDPxZr9z1zin082RlXxJ6KU8pcqX5bDybDO+3ux1joTzMlOxFZV54o0efCZ6kRb6kUCyYL4dYl7PrG92/lOp/0hXSNNeqv5rUbRrPBWk9miuz+0Z0YUTf/bSEgwv9W08tvNGqPLDdtDyuv4WqPr3W7sFbHQbSsFX6/IBADlfzf3vHBf9PuUCHdz/LcjPRHcPTdEnsCKch+3MZrM4JkZBjELYxwZySyDMZnfrwkxFms3aKocsRghSUXWhqBbhiTlpwIBIGDj6D2PTltrvpAU7m0AePqxa+X2Zb8d+b5LuFu4D4AEBvDwCI+XYUy4I58Yff84IHT9xPoWXuXUC3j1YC/jP3bllG6gPDq+QlhRr7APcUlzL6UqE+6Ift/6AQHfjgw7yb2Ns1g7vvSUkODAvQ1TlAfMkrCgSac3YJ8Ym7qLTM9cF12psyxWwqCMWQQFgxaDCRMWh1TzFg+7KywBGq7dWkyxNPLhLssCTz2zta7BsD2KA/FmALfRZzOL4MyqxWBh91u15rTlz+JlJGoJPC19a3FmaTnxPmVZlIw7t9ZnZNvgD51n0PY3RLhkrahdqS6f3bb/uEdUcubxLxWGmoC1j0dapIb77Hj1JlPP94H24q203P7GLc+CF7khCjQeuYw1UdZ4p7nR2Rm/nTsmlpzlxisFRBVEgYTPVSyHnrQbL1mVHEzGC5s9g3irPAu/Bk5kSbzaYEPL5V8DzhJ3yeG/8BSuLN2gGqGgV6l/oGaIXP6YlnCm0zzo2OIkdyr88EYHX0tnOoD30bdaUfk70fmjlfqNk2wV62lf0U2OznCxJeIJ9oANzQ54ublFkGHl0cVBHmtHrbSJPS7IjkhjEUDl1JA32V08/BhWNZbGciFTDmO0XnVR87A/7NhKj+ha79PFyksdKLCtIp1mH1LbjGa1aGTzyUSBlO2Q681Bp4Zbb1Ew9EI3NNydfjR3F7EWkgrjTv0rIypsTyDBzlCu/ydJdtyj6fRkum3wamPditDCi4iWacBM75BSx28pA3zUL2jC1Db5RZQeJWcuFoh2vKqHkVOnH249oFEK0jRyuEMGD5qxQINNmuVftaIOtBjUG8veti4DiOh+Bo8YSttiaq4H2LFpsaSYFGVrQEVjnYUZnVjjXtSbh/hRhihXK9yhPccjau9ppD9Vwfnmd2kpqnNl3ukWGn1f8kqJrcb/lihUMZJS0pbWdYen8QxxxONOCCSSiSQyk0wKqaSZLtBEtzvjDt3Z5/a+ni8qDPsj4sQ08HrhNi4SlzGynUKFMEV6FYrFfFzh5Yo3tRd/HkoW0cGJSU9ZrXlbEE8LyGnHlC76A2Be3/0eLU8aruqMzYafER8WKMP3L4VvqAcL5vtjInW997agHv9uo5fDH7BYXYGwkAcAAAA=) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABHYAA4AAAAAH7gAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAAHnAAAAE4AAABgRbpbgGNtYXAAAAfsAAAAogAAAar/FJbOY3Z0IAAADoQAAAAKAAAADAAAAABmcGdtAAAIkAAABYwAAAuX1RTb8Gdhc3AAABHQAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAAVKAAAHzrxbewZoZWFkAAAG6AAAADYAAAA2EIN07WhoZWEAAAd8AAAAHwAAACQGBgH2aG10eAAAByAAAABbAAAAbD0F+5psb2NhAAAGsAAAADgAAAA4GmscjW1heHAAAAaQAAAAHwAAACAArwv5bmFtZQAADpAAAALCAAAG50zL6Ldwb3N0AAARVAAAAHoAAAC6UaNkMnByZXAAAA4cAAAAaAAAAH/i0Eg6eNqtVWOcJMkTzcjMyiw1Sj3asdZo7uxgrcFitP7btm3bONu2bX86W2uruvYiu/vD2RHlehUvX0T8ogglaULILTQgjEiiXyg4EDpzSsbJOJ0ZpzX9j4+l0zQobk7DuQTIveEAvVI7jTQQcb5DYeYU8GVrZ0cnYR25bMGFfKGQSQW+FNRJem5Vil4pGnlDV3TbDClnQL6rgTcK6/or52182gpHmeDVvTBGe1Z942vDtBvGequ5YNy+rXhV9PXo+iMk+ttWmyBrC7LGkbUOWX2OrO1JyOYzmapUFfEUHQUhZWtLRy5fIHBG9A09nkBWyCvW6DZkTSTkjG5oOsxq4Dc6R9ro9OKNw1/7+uriDdHpSMv1GUPwI8VVCAfYw8gVIJdBkMtrUdLypJDPpFNSMIFpkmK1lQDGvkC1pO2A+GNjdO2G6BEuwwHX5NQw2pntWm704+HwjJ3hXm6pyPtRBcfIEiNDKbLTHLQ6mWA/xO6+OxwwPti3v75PIWdX1lCFyHg5y6K1pbMDOkgnzaHyVFUKUqTKZQ8nzYTk0SMbomsb/5a0Y4JD6waY2/j38BNW0uLM2slGh+F3uh2nBg/37gzPGI6+jAxWOADVlbUwUGvJNTvNuYxjQSzafbf2ub59x/bpTyHyJ7jqzyByJSKbFRJUwTtwY1Sd0bP5fKHknqtOhUwVlgR7QLlgVB1lnEpZlUrh5vkBntSujgH9jGiIf+g7rgZo9kcW2wCU63Nn5WOAprXfmGwQ1Gyr/aDPSw8SH1/JbEkNZ+wLSfUNB/+DtW0mDVcLMfH7A0E3OLDAXPHjdsmZrzPe3L14xIQF4PQE/x6TIpGklLv+8g/4s6Pt0Y6eYPG3JlPBgRmTv78s6Il2zhy402H0A8t9l1OaVNX4aSUDSzEDHaoabjbfTStiPJSBjk2IIpXLimDVjr00W8mMWz4VCipfmDf0n2q2Fk984NuuAJTsfKq9WjLg2pzJCxMUnwj32x9IxJOCS07/UQMUYtmq9kkzff/yOryp+Uecar9oQMnf7a/qjXZE18S/MT7B4iJmou76Gcs3xaOrox29Vf3fnSi4KYUhGMDw7xz6teTK+fUNTTWG+eHjHfpV53fDgqPKIyHNaiczTjxUaXJUyURboaDxjC9lS1tri8ax7NyEz1x2GXwWnXOt2MNZ9N/o/4xzuoGNTZk6Ogae94uFCz1P5Q3oR7Tj6FbSjhFlqd87y+nIpMtJy6TxuqrUKNjcyltbpLDMj/i//Eqmq9se+uH6OdMKx+8LmPn10/5or7eHfry+a7p6QD/SzJq0KQkd9PZaXa6SzVprzgaQHaU7ZD+0lmYJe7keeB09h9a+XBAvdr+xIDi0iX7kSPRyPfC29Bz65PsgCMgXw34WYhfWI3udp9ixj7KlTuvo7CwUvGx5QlX5ROKwgFPoQ9AkHa4JGRscuhdCKmxhQ/EBzgI7HAROgWWtCUJqeuw73w5nM/1TmmlKfd9N3FDV24dd34182sunVbOzDxZHB0uzat9jlTmySqFePkdaHQsW95VmiNH8BrEyGG1fH0gVat9jfeT1YoFC5cDtiy4Pf20040RC1A/CfvoHRKUQ5WqIKuQ8t6Q8CBj1PS/wVfbZDza/SK1kzHkeza1O0Bd3ObSf9vOEG9OLVxSvEsWrilcacSfBab9i/wCu8YuVmWuX534OI2cZDtxyiTE0o1J8vwEjvgCG71j0xc2bN4MeDjQYdCFdIOgCuihGaSrBixcVL3KKFxYvgAShBA2mko9V/rBa+Q87K5cJMrh/rGzkbeOAKPuYwpXzWcaody8Bug6YdwAAeNpjYGRgYJBmCGBgYgACMCnAUA4kpbingwQAFRABtAAAAAAWABYAFgAWAFEAhwC0AMkA+gEPAZACAwIDAiwCawKUAtMDCwMeAzEDRANXA4MDsQPFA9kD5wABAAAAAQAAd4gR/V8PPPUACwPoAAAAANiymQoAAAAA2LKZCvpY/EoFpwWqAAAACAACAAAAAAAAeNpj+MVgxAAEjL4MDEA2A9MDhotArMQiwmDOJMDwHUhbAGlupncMTUDcDFLDuuT/H9YlDIxADRFAHMv8giGfyZ3hGxBzQ2iw+jogjmPUYWAAYYYUBgYASjgYwQB42mNgZGBgXfXHiyGKdcmviP9vWJcDRVCBNACq/gb/AHjaY2BiWs04gYGVgYGpi2kPAwNDD4RmfMBgyMjEgAQaGBjeCzC8eQvjB6S5pjA4MCi8/8+s8N+CIYp1FfM2BQaG/jhmuBYFBkYALwQQzQAAeNpjYGBghmIZBkYGEFgC5DGC+SwMHUBajkEAKMLHoMCgyaDPEMtQzVDLsIDpGNMdZmYlKWVu9Zfv////z8AAlNcAykcjyTMB5TnUX7z/C1Tw+P+d/9f/r/nf/7/vf85f979Gf3nvfr/LdUNPQBpoGwHAyAbEMDYTkGBCVwDyAgSwsIIpNgbiATsHJ155LgZuBmoAQQjFQ4IWXj4YCwD1UyhaAAB42qxV5ZrjyA4th5phGHxBnpr07ZuUPcxsx8nwNH6fa9Fu+r28+wx+GjnL//bR9shJc/dyQ1SlUklHR1KFlSFWq0lsiV79pKYXX3Fj+b2Eb7o8b9MtylcTrjSzn0fVqFpf12uu57GyrCLd6StHRWnos2OY0i2fK4Y2iH9Z4Nrce/15ZzyK1+Ol9xNPe26eEC8sJB4/tS7xXVndtZaKgVG2wfNQDXfEV+X8KizhLCGAyDPi8YUkhYbkbFxWt2V1O3VTa63LTttazWoh2bTW56oh+Kk1MwCqRwsJ13XIDR0CvmUn9blmNHDRRlFfC0lOBsHlk1Uar3O15UEfUU45fBdX602ktZikC262ZBNtcfp0OcGRi6S2I/tcNzwStfuqMqCmga0ONbHSYcaVtS121hGf6y2fRwwJyIlo/aeaWiPxwE9TKyZppwQ5avojEyqKw5a3Q/aY2U/+eOkFODT0yDilONcZbQyZUq6wyeQC5DZKrjZ11hmEmDjmOl/GLYVbR12aNGVC/Ynxapx4rvZsy/N5yhSVSswbWcfnaQNDIp6MXsp1LHRoeUp2S9hNYefzDNzMlpQQGFhHXJ6OUspT4mmQ5vOsebWSFLWNjr3MU5v6G59PmFeLyavlgdL1oD9V6k+aQs1Eq0kxMxOxk4U805YmReuGxaR8TOGDnbOakMdCUgh5yDbMcyrDtjyNa9trd3COK/gvNRaZ9IC/B+3+Uh1TwEKpUxpsRawe9x3HKWt1yqhCVeKVhGd0SDFP6JDHwW8aUorw38/OOmpahWGeFicbbf6y7V4CTaeR26m2z2dM4Yg8C55FnjNFVeR5U9REXjBFXeRFUzREuqYYEfkvU4yK/LcpxkT+31DAzoc+t8rFpz63y8VnPv/HKJ5q/wWM/wXG/8A3AaNIDxhFXgJGkRoYRV4GRpFNYBQ5B4wi/weMIueBUaQx9LBsNd8g7GxKkcY2knJAspF+Cwz7bfYxSVcMUY+OqYTO7mp5xn7TAq3k89Wd8jhn+UqrqDtn4uSqLRO8VjJz7PF1Q7dKvDdg58SHg2DCEPxovTr7nZKfzmN9t7junEFGN5E/9Y7ByyrK7vp8ywTnHvp8+/dM2YnWYX4HJVFnmxRQj5WWzn6R5z3d0xkla8ifHUz0bcc5cxrx7xqgwoDgrzThsai9mQea6GEOX/d2jykY+OCaDsWKOJV5f7qYfFuhKrnfVuaqF20ob+BoRLkurXUX04dqHkBLYGPw2FeidENzNco2FhJsMhfrVN6gg3cyTQg9p7uooUaELvKCKKOkdFQQLVE0TlJIrqOh6oe8wqNk1CxB4HNh8MrtxkLJ7wsHBE19bsiBfghqHogaueoQZ13dk2BSrYeiLxMYMqpWkoAeas+FZlsJZ7uUN5rYvdj77Tso1FEdPKyMljZ+NEQQbZcmla/ngylul/Kx0RQIa108zA9tUATOaQzgkx31wl710/3WR9o8M3y3faTT0PC9do7A0ixAe9gGZQk4gGm002Fgd6cFNVo90HeH7jp4NPCG/4VW7P1T3Sfws7uApfGE7Km3Z4cYYyFjO/+u5O/pIQH67v6Ue0j5zGA4+0rm8FTANzGLz4/RvzCFck6f4ltYvzR8B+KVsBaDV+rmQPFrj/WAHEEABFA0xj1STOcCsb22OWv7WIMLbv9R8XXVH9Pf7L9wO5p/yojY+p5RRBWHICb24QGIKw5BguZDkaQBKRqQpgEZmhdFlgbkaECeBhRo3hRFGlCiAWUaUKH5VFRpQI0G1GlAg+ZV0aQBLRrQpgGGmLfhae4wmI+qrqsnVY8zw/CsQ1/Mu7AeMLj1ELn1CLnpWMz7MJ0wuOkUuekMuelczIcwXTC46RK56Qq56Vqcy5Oj4Ofp9dq8MMzjq/gu+Kbc7AERbE1geNpj8N7BcCIoYiMjY1/kBsadHAwcDMkFGxnYnDYyMGhBaA4UeicDAwMnMouZwWWjCmNHYMQGh46IjcwpLhvVQLxdHA0MjCwOHckhESAlkUCwkYFHawfj/9YNLL0bmYC6WFNcAJhIJBt42mNAAgAADAABAAB42kzMtYFCYRAE4PntDncPsQYgxiF/ORFWChWgIW4VUAp1kOODbPStDYCI8EDgVRZACzhh0RL/aNIKKbRpjSD6tIEbU/rvZ+4WOaxpDxLiRPt+8v3PfAWh7QDm4kwLROSQlvDIA63QkEdaIyuvtEFCZei/n7lb9lSR9iBvVrTvJ9//yK/eWqPCnsSBIPo+91fMR0nKUpAPSowJOUNCIBLFGL+ZtYx0tZSmu1D11984cB7cSc67XDbbfXl9897s7LJ8rdw8C3SUNqiTJKfNTtJO6IK9mxc0TR0XKcc0LFIT/Spud9/FJzTKbEH91M548TqyN3x3P3VvfHzN81Vuq8GyCINlNWfqmIR6tKNobiWfULdcebcsKDGJ6R7oMv60TTo6q+vaLGzInuyLkeTzxpda3xY+C2U3zKY4jmoXMrpmz9WaZ/R+Ibq0C969iomim8z5zc/p8jHUtmISIncpF17KVsWMKwoZ03Q4pknJxUY83ghi+nHltmkbMftZS3ZtXW4fcibtxNKgf0U29KIshLLXavm0cmXwxrv8veXWZDA+/AffsESJV1RwmCNDAOEIKRpydpDIOkVTUVs24QIMr9oChClSwSw4lW8szFCxQfRH5za6H84nwo1EY9W1j1TQDIyF1I8E3wi+w73kObwJPsY1WFxXyGElYSBZBYKelfCsGUY77oEOeDT3Xb6ougXL18NpJkmG0d39y1nGX5+m+pyh1mWwgEUQ/yc5X2C2dz5H4z9OfT/xeauye5rd5BiRKJ32RToxr3Nag0VPHy9EuISVaj74KkacIuEzYfxe5VTQo6Ba34FBW0UuZ6pz89u0leCZ5pN2xFo9xFjOCUrV7jqP9xxi0G+v3IbRrZ19mkuwWMt2wls8yFe4nZlYTezjSnFAD5HwQVYpuCXLI9V3KxEEG03PP6bcwkTqx/9S8x3ziVjpAAB42m1JxQHCQBCcucMdvhSBu2sXuLtXQC30BM1gyT6zMgoFYz53JGE1UQCEgoYXPkRQRQ119DGkwhMvatrwoJ0OOumimx566aPfeduv4vFG3OBUPOm+rrbT2eSwG/+TZCqeFy4IN4SbBuc6eWGj73S7beGOcPcL1/sicgAAAAEAAf//AA8=) format("woff"),url(data:font/ttf;base64,AAEAAAAOAIAAAwBgT1MvMkW6W4AAAAncAAAAYGNtYXD/FJbOAAAKPAAAAapjdnQgAAAAAAAAGAAAAAAMZnBnbdUU2/AAAAvoAAALl2dhc3AAAAAQAAAfsAAAAAhnbHlmvFt7BgAAAOwAAAfOaGVhZBCDdO0AAAkUAAAANmhoZWEGBgH2AAAJuAAAACRobXR4PQX7mgAACUwAAABsbG9jYRprHI0AAAjcAAAAOG1heHAArwv5AAAIvAAAACBuYW1lTMvotwAAGAwAAAbncG9zdFGjZDIAAB70AAAAunByZXDi0Eg6AAAXgAAAAH8AAgAyAAAAyAIVAAMABwAItQYEAQACMCszETMRJzMRIzKWZDIyAhX96zIBsQABANH8SwK9BaoAHgAGsxECATArARQHIycmJwADJjU0NxIBNjc3MxYVFAcGAhEQExIXFgK9Bh8EHjn+yi8HBy8BNjkeBB8GC8O9QFzkC/xUAwYEGD0BVQI8UHZ0UgI7AVU9GAQGAwQMyv2+/nX+w/8A/pTtDAAAAQAi/EsCDgWqABsABrMUBAEwKyUQATQ2MzMXFhcAExYVFAcCAQYHByMiJjU2NwABrP52CA4PBB45ATYvBwcv/so5HgQPDwcvOwEg+wMZAYoIBAQYPf6r/cVSdHVR/cT+qz0YBAQIL00BgAAAAQA3/EsD3AWqABUABrMJAAEwKxMiJjU0NzYANzYzMhYHBgMGAAcABwZRCw8BAwNuAgUQDBEBBo8f/sFb/t0EB/xLEgoEAgkJJQMMEgsS/oFS/Kzx/PUECwAAAQD3/EsCBAWqAAcABrMBAAEwKxMRIRUjETMV9wENz8/8SwlfPvcdPgAAAQA4/EsD3AWqABcABrMOAgEwKwEUBiMiJyYBJgAnAjU0NjMWFxYBFgAXEgPcEAoPBwT+3Vv+wR+UEAwNBgQBI1sBPx+V/GYLEAsEAwvxA1RSAYwIDA4CCQT89fH8rFL+cQABAAv8SwEYBaoABwAGswMBATArEzUhESE1MxELAQ3+888FbD72oT4I4wABAIL8SwJqBaoATwAGsyEBATArAQcjJyYmJyYmAwInJiYnJicmNDY2NzY3Njc2ExI2NzY3NzMXFRQHFAcGBwYHBgYDAgYHBgYHDgIHBxcWFhcWFhMUFRYXFhUWFxYXFhUWFQJqBh4OYHoSBQEBAQEMYkUMAQECBAg/MTYNAQEBAQUlxRAeBgIKJBpfFAQBAQEBBQ9lTwMMBwIJEVVuEAUBAQEEARRfGiQKAvxRBgYofUsVOwERAUIKToElBwQDFAgDBCE7RVMKAUIBETwVmVUHBg8QAgIEEhRJXhQ4/u/+8DwVRXgqAgYEAQMJKn1IFTz+8TBLzREDAl5JFBIEAgIQAAABAIP8SwJqBaoARwAGsyYCATArEjQ2OwIXFhYXFhYTExcWFxYXFhYVFAYGBwYHBgcHAwIGBwYGBwcjIiY9AjQ2NzY3Njc2Ejc2NzY3Njc3JyYnJgInJicmJ4MFDAUOD155EgYBAQECEWglGAcDAQQFOipDDwIBAQEGEnleDw4QBgQHBAKWGQECAQ00FyUpMBQUuxsBAgEZlg4CBYYeBgYoe0oXPf7w/sAOdlYcCwQGDQoHBAMdL0ldDv6//vA9F0p7KAYECgcGCQYDAQFSjBECdBBPQR0eIBkJCmGjEQJzEYxSBgQAAAH//AI0BacDBAATAAazCgQBMCsDBiQ3NwUEMxQHByIkIyIFBCMnJgQKAWq6ugFrAWsBBAQF/TwEA/6b/p0DBAQCWwNVKyxUVQETE4ZDQxMTAAABAAECYgWiAu0AJQAGswcAATArEyc0Njc2NzYzMhcWFxYXFjMyNzYzFxQHBgcGIicmJyYnJiMiBwYLCmIUh3IzOTsMTX9aOi03o/YVAwp1qo8MWgxNgVo5Ljej9hUCYiEDIAUrDwgBCCUaCAdQByEFIzUMAQEHJhoIB1AHAAAB+lgCNAADAwQAEwAGswoEATArAQYkNzcFBDMUBwciJCMiBQQjJyb6WAoBarq6AWsBawEEBAT9OwQD/pv+nQMEBAJbA1UrLFRVARMThkNDExMAAfpdAmL//gLtACUABrMHAAEwKwEnNDY3Njc2MzIXFhcWFxYzMjc2MxcUBwYHBiInJicmJyYjIgcG+mcKYhSHcjM5OwxNf1o6LTej9hUDCnWqjwxaDE2BWjkuN6P2FQJiIQMgBSsPCAEIJRoIB1AHIQUjNQwBAQcmGggHUAcAAQBv/EoD/AWqAB0ABrMbEwEwKwEmAic0BwYGBwcmJyc3NxM0ADc2MzIWFxQABwYjIgGoAtsBIAcRBAUGBw1MTdEB/AIGDAYMAf3UBAMVDPxMAQQCAQM0CxwGBwUIDXp5/DgDCGgFCgoHCPbGBAkAAAEA9vxLAjsFqgAFAAazAQABMCsTESEVIRH2AUX++fxLCV8+9t8AAQAL/EsBUAWqAAUABrMDAQEwKxM1IREjEQsBRT4FbD72oQkhAAABAPb8SwI7BaoABQAGswEAATArExEzESEV9j4BB/xLCV/23z4AAAEAC/xLAVAFqgAFAAazAwEBMCsBETMRITUBEj7+u/yJCSH2oT4AAQB+/EoCjgWqABYABrMSBQEwKzc1ExI3NjMyFhUVAwIUExMVFAYiJyYDfuvqAgsQDRHo6OjoEhgPAuryEQJKAkoEDxINCP28/b4G/b79vQkOEQ8EAkoAAAEAXvxLAm8FqgAXAAazDAABMCsTIjU1ExI0AwI1NDc2MzIXFhMTFQMCBwZ9Hujo6OkBCRQRCwLq6+vrAQj8Sx4JAkMCQgYCQgJEDQICFg8E/bb9thH9tf20AQ8AAgAAAAABLABkAAMABwAItQUEAQACMCsxNTMVMzUzFWRkZGRkZGQAAAIAAAAAASwAZAADAAcACLUFBAEAAjArMTUzFTM1MxVkZGRkZGRkAAABAAAAAABkAGQAAwAGswEAATArMTUzFWRkZAAAAAABAAAAGwBQAAIAAAAAAAIAAAAQAHcAAAAaC5cAAAAAAAAAFgAWABYAFgBRAIcAtADJAPoBDwGQAgMCAwIsAmsClALTAwsDHgMxA0QDVwODA7EDxQPZA+cAAQAAAAEAAHeIEf1fDzz1AAsD6AAAAADYspkKAAAAANiymQr6WPxKBacFqgAAAAgAAgAAAAAAAAD6ADIAAAAAAU0AAAD6AAAC4ADRAuAAIgQUADcCEAD3BBQAOAIQAAsC7gCCAu4AgwD6AAAFpP/8BaQAAQAA+lgAAPpdA+gAbwJHAPYCRwALAkcA9gJHAAsC7gB+Au4AXgEsAAABLAAAAGQAAAABAAAFqvxKAFoFpPpY/+wFpwABAAAAAAAAAAAAAAAAAAAAGwACAqsBkAAFAAACigK8AAAAjAKKArwAAAHgADEBAgAAAAAAAAAAAAAAAIAAAO8QAOztAAAAAAAAAABQZkVkAEAAIO//AyD/OABaBaoDtiAAAI9eAwAAAAAAAAAAACAAAQAAAAMAAAADAAAAHAABAAAAAACkAAMAAQAAABwABACIAAAAHgAQAAMADgAgACkALwBdAHsAfQCgAsYC3AMDIhojCyfp7////wAAACAAKAAvAFsAewB9AKACxgLcAwIiGiMIJ+jv/f///+P/3P/X/6z/j/+O/2z9R/0y/Q3d990K2C4QGwABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAABBgAAAQAAAAAAAAABAgAAAAIAAAAAAAAAAAAAAAAAAAABAAADAAAAAAAAAAQFAAAAAAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAcICQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACgALAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAEQAAAAAAAAwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADQ4AAAAAAAAAAAAAsAAsILAAVVhFWSAgS7gADlFLsAZTWliwNBuwKFlgZiCKVViwAiVhuQgACABjYyNiGyEhsABZsABDI0SyAAEAQ2BCLbABLLAgYGYtsAIsIGQgsMBQsAQmWrIoAQpDRWNFUltYISMhG4pYILBQUFghsEBZGyCwOFBYIbA4WVkgsQEKQ0VjRWFksChQWCGxAQpDRWNFILAwUFghsDBZGyCwwFBYIGYgiophILAKUFhgGyCwIFBYIbAKYBsgsDZQWCGwNmAbYFlZWRuwAStZWSOwAFBYZVlZLbADLCBFILAEJWFkILAFQ1BYsAUjQrAGI0IbISFZsAFgLbAELCMhIyEgZLEFYkIgsAYjQrEBCkNFY7EBCkOwAGBFY7ADKiEgsAZDIIogirABK7EwBSWwBCZRWGBQG2FSWVgjWSEgsEBTWLABKxshsEBZI7AAUFhlWS2wBSywB0MrsgACAENgQi2wBiywByNCIyCwACNCYbACYmawAWOwAWCwBSotsAcsICBFILALQ2O4BABiILAAUFiwQGBZZrABY2BEsAFgLbAILLIHCwBDRUIqIbIAAQBDYEItsAkssABDI0SyAAEAQ2BCLbAKLCAgRSCwASsjsABDsAQlYCBFiiNhIGQgsCBQWCGwABuwMFBYsCAbsEBZWSOwAFBYZVmwAyUjYUREsAFgLbALLCAgRSCwASsjsABDsAQlYCBFiiNhIGSwJFBYsAAbsEBZI7AAUFhlWbADJSNhRESwAWAtsAwsILAAI0KyCwoDRVghGyMhWSohLbANLLECAkWwZGFELbAOLLABYCAgsAxDSrAAUFggsAwjQlmwDUNKsABSWCCwDSNCWS2wDywgsBBiZrABYyC4BABjiiNhsA5DYCCKYCCwDiNCIy2wECxLVFixBGREWSSwDWUjeC2wESxLUVhLU1ixBGREWRshWSSwE2UjeC2wEiyxAA9DVVixDw9DsAFhQrAPK1mwAEOwAiVCsQwCJUKxDQIlQrABFiMgsAMlUFixAQBDYLAEJUKKiiCKI2GwDiohI7ABYSCKI2GwDiohG7EBAENgsAIlQrACJWGwDiohWbAMQ0ewDUNHYLACYiCwAFBYsEBgWWawAWMgsAtDY7gEAGIgsABQWLBAYFlmsAFjYLEAABMjRLABQ7AAPrIBAQFDYEItsBMsALEAAkVUWLAPI0IgRbALI0KwCiOwAGBCIGCwAWG1EBABAA4AQkKKYLESBiuwdSsbIlktsBQssQATKy2wFSyxARMrLbAWLLECEystsBcssQMTKy2wGCyxBBMrLbAZLLEFEystsBossQYTKy2wGyyxBxMrLbAcLLEIEystsB0ssQkTKy2wKSwgLrABXS2wKiwgLrABcS2wKywgLrABci2wHiwAsA0rsQACRVRYsA8jQiBFsAsjQrAKI7AAYEIgYLABYbUQEAEADgBCQopgsRIGK7B1KxsiWS2wHyyxAB4rLbAgLLEBHistsCEssQIeKy2wIiyxAx4rLbAjLLEEHistsCQssQUeKy2wJSyxBh4rLbAmLLEHHistsCcssQgeKy2wKCyxCR4rLbAsLCA8sAFgLbAtLCBgsBBgIEMjsAFgQ7ACJWGwAWCwLCohLbAuLLAtK7AtKi2wLywgIEcgILALQ2O4BABiILAAUFiwQGBZZrABY2AjYTgjIIpVWCBHICCwC0NjuAQAYiCwAFBYsEBgWWawAWNgI2E4GyFZLbAwLACxAAJFVFiwARawLyqxBQEVRVgwWRsiWS2wMSwAsA0rsQACRVRYsAEWsC8qsQUBFUVYMFkbIlktsDIsIDWwAWAtsDMsALABRWO4BABiILAAUFiwQGBZZrABY7ABK7ALQ2O4BABiILAAUFiwQGBZZrABY7ABK7AAFrQAAAAAAEQ+IzixMgEVKi2wNCwgPCBHILALQ2O4BABiILAAUFiwQGBZZrABY2CwAENhOC2wNSwuFzwtsDYsIDwgRyCwC0NjuAQAYiCwAFBYsEBgWWawAWNgsABDYbABQ2M4LbA3LLECABYlIC4gR7AAI0KwAiVJiopHI0cjYSBYYhshWbABI0KyNgEBFRQqLbA4LLAAFrAEJbAEJUcjRyNhsAlDK2WKLiMgIDyKOC2wOSywABawBCWwBCUgLkcjRyNhILAEI0KwCUMrILBgUFggsEBRWLMCIAMgG7MCJgMaWUJCIyCwCEMgiiNHI0cjYSNGYLAEQ7ACYiCwAFBYsEBgWWawAWNgILABKyCKimEgsAJDYGQjsANDYWRQWLACQ2EbsANDYFmwAyWwAmIgsABQWLBAYFlmsAFjYSMgILAEJiNGYTgbI7AIQ0awAiWwCENHI0cjYWAgsARDsAJiILAAUFiwQGBZZrABY2AjILABKyOwBENgsAErsAUlYbAFJbACYiCwAFBYsEBgWWawAWOwBCZhILAEJWBkI7ADJWBkUFghGyMhWSMgILAEJiNGYThZLbA6LLAAFiAgILAFJiAuRyNHI2EjPDgtsDsssAAWILAII0IgICBGI0ewASsjYTgtsDwssAAWsAMlsAIlRyNHI2GwAFRYLiA8IyEbsAIlsAIlRyNHI2EgsAUlsAQlRyNHI2GwBiWwBSVJsAIlYbkIAAgAY2MjIFhiGyFZY7gEAGIgsABQWLBAYFlmsAFjYCMuIyAgPIo4IyFZLbA9LLAAFiCwCEMgLkcjRyNhIGCwIGBmsAJiILAAUFiwQGBZZrABYyMgIDyKOC2wPiwjIC5GsAIlRlJYIDxZLrEuARQrLbA/LCMgLkawAiVGUFggPFkusS4BFCstsEAsIyAuRrACJUZSWCA8WSMgLkawAiVGUFggPFkusS4BFCstsEEssDgrIyAuRrACJUZSWCA8WS6xLgEUKy2wQiywOSuKICA8sAQjQoo4IyAuRrACJUZSWCA8WS6xLgEUK7AEQy6wListsEMssAAWsAQlsAQmIC5HI0cjYbAJQysjIDwgLiM4sS4BFCstsEQssQgEJUKwABawBCWwBCUgLkcjRyNhILAEI0KwCUMrILBgUFggsEBRWLMCIAMgG7MCJgMaWUJCIyBHsARDsAJiILAAUFiwQGBZZrABY2AgsAErIIqKYSCwAkNgZCOwA0NhZFBYsAJDYRuwA0NgWbADJbACYiCwAFBYsEBgWWawAWNhsAIlRmE4IyA8IzgbISAgRiNHsAErI2E4IVmxLgEUKy2wRSywOCsusS4BFCstsEYssDkrISMgIDywBCNCIzixLgEUK7AEQy6wListsEcssAAVIEewACNCsgABARUUEy6wNCotsEgssAAVIEewACNCsgABARUUEy6wNCotsEkssQABFBOwNSotsEossDcqLbBLLLAAFkUjIC4gRoojYTixLgEUKy2wTCywCCNCsEsrLbBNLLIAAEQrLbBOLLIAAUQrLbBPLLIBAEQrLbBQLLIBAUQrLbBRLLIAAEUrLbBSLLIAAUUrLbBTLLIBAEUrLbBULLIBAUUrLbBVLLIAAEErLbBWLLIAAUErLbBXLLIBAEErLbBYLLIBAUErLbBZLLIAAEMrLbBaLLIAAUMrLbBbLLIBAEMrLbBcLLIBAUMrLbBdLLIAAEYrLbBeLLIAAUYrLbBfLLIBAEYrLbBgLLIBAUYrLbBhLLIAAEIrLbBiLLIAAUIrLbBjLLIBAEIrLbBkLLIBAUIrLbBlLLA6Ky6xLgEUKy2wZiywOiuwPistsGcssDorsD8rLbBoLLAAFrA6K7BAKy2waSywOysusS4BFCstsGossDsrsD4rLbBrLLA7K7A/Ky2wbCywOyuwQCstsG0ssDwrLrEuARQrLbBuLLA8K7A+Ky2wbyywPCuwPystsHAssDwrsEArLbBxLLA9Ky6xLgEUKy2wciywPSuwPistsHMssD0rsD8rLbB0LLA9K7BAKy2wdSyzCQQCA0VYIRsjIVlCK7AIZbADJFB4sQUBFUVYMFktAABLuADIUlixAQGOWbABuQgACABjcLEABkKxAAAqsQAGQrEACCqxAAZCsQAIKrEABkK5AAAACSqxAAZCuQAAAAkqsQMARLEkAYhRWLBAiFixA2REsSYBiFFYugiAAAEEQIhjVFixAwBEWVlZWbEADCq4Af+FsASNsQIARLEFZEQAAAAAAAAAAAAAAAAAAAAAFgEOAAEAAAAAAAAAUQAAAAEAAAAAAAEACwBRAAEAAAAAAAIABwBcAAEAAAAAAAMAIwBjAAEAAAAAAAQAEwCGAAEAAAAAAAUADQCZAAEAAAAAAAYAEwCGAAEAAAAAAA0BMwCmAAEAAAAAAA4AGgHZAAEAAAAAABAACwBRAAEAAAAAABEABwBcAAMAAQQJAAAAogHzAAMAAQQJAAEAFgKVAAMAAQQJAAIADgKrAAMAAQQJAAMARgK5AAMAAQQJAAQAJgL/AAMAAQQJAAUAGgMlAAMAAQQJAAYAJgL/AAMAAQQJAA0CZgM/AAMAAQQJAA4ANAWlAAMAAQQJABAAFgKVAAMAAQQJABEADgKrQ29weXJpZ2h0IChjKSAyMDA5LTIwMTAgRGVzaWduIFNjaWVuY2UsIEluYy4KQ29weXJpZ2h0IChjKSAyMDE0LTIwMTggS2hhbiBBY2FkZW15S2FUZVhfU2l6ZTNSZWd1bGFyRm9udEZvcmdlIDIuMCA6IEthVGVYX1NpemUzLVJlZ3VsYXJLYVRlWF9TaXplMy1SZWd1bGFyVmVyc2lvbiAwLjAuNENvcHlyaWdodCAoYykgMjAwOS0yMDEwLCBEZXNpZ24gU2NpZW5jZSwgSW5jLiAoPHd3dy5tYXRoamF4Lm9yZz4pCkNvcHlyaWdodCAoYykgMjAxNC0yMDE4IEtoYW4gQWNhZGVteSAoPHd3dy5raGFuYWNhZGVteS5vcmc+KSwKd2l0aCBSZXNlcnZlZCBGb250IE5hbWUgS2FUZVhfU2l6ZTMuCgpUaGlzIEZvbnQgU29mdHdhcmUgaXMgbGljZW5zZWQgdW5kZXIgdGhlIFNJTCBPcGVuIEZvbnQgTGljZW5zZSwgVmVyc2lvbiAxLjEuClRoaXMgbGljZW5zZSBhdmFpbGFibGUgd2l0aCBhIEZBUSBhdDoKaHR0cDovL3NjcmlwdHMuc2lsLm9yZy9PRkxodHRwOi8vc2NyaXB0cy5zaWwub3JnL09GTABDAG8AcAB5AHIAaQBnAGgAdAAgACgAYwApACAAMgAwADAAOQAtADIAMAAxADAAIABEAGUAcwBpAGcAbgAgAFMAYwBpAGUAbgBjAGUALAAgAEkAbgBjAC4ACgBDAG8AcAB5AHIAaQBnAGgAdAAgACgAYwApACAAMgAwADEANAAtADIAMAAxADgAIABLAGgAYQBuACAAQQBjAGEAZABlAG0AeQBLAGEAVABlAFgAXwBTAGkAegBlADMAUgBlAGcAdQBsAGEAcgBGAG8AbgB0AEYAbwByAGcAZQAgADIALgAwACAAOgAgAEsAYQBUAGUAWABfAFMAaQB6AGUAMwAtAFIAZQBnAHUAbABhAHIASwBhAFQAZQBYAF8AUwBpAHoAZQAzAC0AUgBlAGcAdQBsAGEAcgBWAGUAcgBzAGkAbwBuACAAMAAuADAALgA0AEMAbwBwAHkAcgBpAGcAaAB0ACAAKABjACkAIAAyADAAMAA5AC0AMgAwADEAMAAsACAARABlAHMAaQBnAG4AIABTAGMAaQBlAG4AYwBlACwAIABJAG4AYwAuACAAKAA8AHcAdwB3AC4AbQBhAHQAaABqAGEAeAAuAG8AcgBnAD4AKQAKAEMAbwBwAHkAcgBpAGcAaAB0ACAAKABjACkAIAAyADAAMQA0AC0AMgAwADEAOAAgAEsAaABhAG4AIABBAGMAYQBkAGUAbQB5ACAAKAA8AHcAdwB3AC4AawBoAGEAbgBhAGMAYQBkAGUAbQB5AC4AbwByAGcAPgApACwACgB3AGkAdABoACAAUgBlAHMAZQByAHYAZQBkACAARgBvAG4AdAAgAE4AYQBtAGUAIABLAGEAVABlAFgAXwBTAGkAegBlADMALgAKAAoAVABoAGkAcwAgAEYAbwBuAHQAIABTAG8AZgB0AHcAYQByAGUAIABpAHMAIABsAGkAYwBlAG4AcwBlAGQAIAB1AG4AZABlAHIAIAB0AGgAZQAgAFMASQBMACAATwBwAGUAbgAgAEYAbwBuAHQAIABMAGkAYwBlAG4AcwBlACwAIABWAGUAcgBzAGkAbwBuACAAMQAuADEALgAKAFQAaABpAHMAIABsAGkAYwBlAG4AcwBlACAAYQB2AGEAaQBsAGEAYgBsAGUAIAB3AGkAdABoACAAYQAgAEYAQQBRACAAYQB0ADoACgBoAHQAdABwADoALwAvAHMAYwByAGkAcAB0AHMALgBzAGkAbAAuAG8AcgBnAC8ATwBGAEwAaAB0AHQAcAA6AC8ALwBzAGMAcgBpAHAAdABzAC4AcwBpAGwALgBvAHIAZwAvAE8ARgBMAAACAAAAAAAA/4MAMgAAAAAAAAAAAAAAAAAAAAAAAAAAABsAAAABAAIAAwALAAwAEgA+AD8AQABeAGABAgDYANkBAwEEAKUBBQEGAQcBCAEJAQoBCwEMAQ0HdW5pMDBBMAd1bmkwMzAyCXRpbGRlY29tYgd1bmkyMzA4B3VuaTIzMDkHdW5pMjMwQQd1bmkyMzBCB3VuaTI3RTgHdW5pMjdFOQd1bmlFRkZEB3VuaUVGRkUHdW5pRUZGRgAAAAEAAf//AA8=) format("truetype")}@font-face{font-family:KaTeX_Size4;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAABOkAA4AAAAAK0AAABNOAAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAg0oIDAmXFxEICqMImjABNgIkA4FYC24ABCAFjWcHg0gMfxuEJbMRNmwcgDjwu2D+6wRuyIS/gdU5iWtyulgw1Wzdm4nbqVapRINEcSR3Ou/GgoE733BULv21sA8bIcnsEW7WzCZZEoIEOCqalqtTDopWhZYqUHGs4qf6ZtZ7NT/Twv+jrZ8VJXiQGx5iWcS+DJY1VBI0s1bUFPV01cngVUcFD/Q73zdmcjIxSRp1R6mQuqY2Q3PpXct3/8NACcBVDgNl1BRz2TixNGB2CIESq80X+h8AtjD81++n/yVcVoQ7+wJ7jMqdeqSP4xsj61wH5+VF+WCE4xjTj+CUkas6+T+bZvtndscw1e1Rkg430HEPABVQ03x9afbt7EhsWEsBSSGSbNb5SNLLkxTGkqGSHUAumqtC2LmpU1RpihTl2ZClJQ/Ezlpd+I5tG84u1F66ORIjod0Lr+8CCMPhhcABkLPJ0wBw7vHB8XuwBQLHHe8A+E+Cv/+Bz9Ox10ehivwvMVraAv3Zp+yPMsAFwwych2S7FhpMStIBeNng4rBw55eZTcYCBVmeFYZsttWN5FXyNcNkJplE032mx3L++B5/CPy31AFGZLnAnQ4w4vCma6p//x5+6PjvxPyX4Cdf+8y9LnC+mRONJ4pOqL85NKP8evPXDeT630oXj/2XXGvrEJCACoyapRMBQK/eOZaD64jC+UgreAGOcSVsgtStHUGggkNTa+BHughmAcE0ztLjP6DpfAx9+JBwnJD7Vlbqgq8Qb//yxQSauc2c90AfUGujHhBUYgBBLlcBghbi+Rew+UOfm1DteD5+9TF5867rvaTjNnmq3pzwRM/zvGVVrFK7IDemkgjg1sCKCs9XaKXu7NYGpS6hQC4MlFHuAle65LvowLhCA4L+0vjaAwwaC9bbheD0IsFZhFp03mewDLCYN69F5eqooph0uguB0aMEs/SJr0Xq5L/F9ajWYSJsfpnKC9e+ysmyF1UPCQxXKyUax2wOFLrQA7ENUF/RiiZA3k4LqVdgA5Zwy4ACaVkjav6HLWqxKFNVZpxcGYUX4ukVm6BxPO+tDcLa1o8r2bw2hgG1sF407kyVFqbKQrI5L0Q+ocpAyKe5tSMZl0Skz7C8jEHDEVRUo6+pFzeY+uSd+XzeB9RU0qsnWo0CGsBSQqVHQ8RCfD6jTrIupsbPuVqEZJNvXX/YoulMFRoVdaOXaCxaQOLxm1TZdpRPou7sW0DH45fp8evcjPOHZdiqngra2re+VtWAVUQbuUbnEI9V9cLU08B9E4yfQbVeGjZW6M6W3JGltzovEXcIQCJbdK3MqDRFTZFwHV8148FXrAAGG4ECKnpM+LoOGFirQOrfJLQWNUa0iNKA0agCVj+lvXWwA6vYjf7rR+msDXciB5ZRwXAhYKRiBOI4gXjOQAJnIZFzkMQpJHMFpHAeUrlQmYcG4Ne08uHXKoD14zqNNdShJEtnaUymABmcQCZnwMRZWM45yOIUsrkCcjgPuVzwzQQNlFBYXZBKDc03Q39gz2JucAvGAoVB4TKwAmkqV5St3bL9WPMoofP5J2X1zzPjPiuWlUvGcbqca2hspmmu/NQidENhbQdeDd5IKYAhvWFBGeJ+wHnh1N2xrVqU6PMBB2o0VTgEauUfFHAyONAEXLh4YSqCn+6mkmL/lAacB0xN+xt62J09tam1SjPnM2ixdyVo3Hs+4AGIg3VYx+mOoAvLzmJS03nyOyke0IBJGdYiWl6MbvDTq+7Sd3K5GePUK+TNsByjCV7qTOihTYrclCDq0o4otrfvQlQWBqN2IREv07oRlJ1QXaK31JoEm23SbjmD1wTiOirmaovGwEBbShejBOftVhcrD5urZFyLPi+x3dwawvx8QUkfxOEc5LIRQmu24lbpNuAtSpqQNHJXUFYQrYEy6QtBIA3UmHeQ3BsIzuYZ6m7bw4ffmKcaNmHlmsDacVB+InN7K543KZeryfNlWIEByWxdJ6+SmjyolkRdiPdW7uxFhyr0xkj3XA2e4FpbA8XRyZdNa7m6zhOqYDXAgk3VNjGRqXWFpsYdtC1+xToqD7msY1v8X0ybH+lPO5g7N7blvMMHfVYyqLeGZwDeMOhtwpo6dWaNcePWme1hQ/T3JPocy93SFHqpPnIG5yg1g1tDy/NB3Ng00KQzVYbK+miPGVrsqlZ6KoA6Zm0coV0isA6O0OkA1LMujuCXCCzAEYIOQDXr5gg9EoH1coQ+B6CW9XOEAYnABjnCkAPQwIY5wohEYKMcIeQA1LAwR4hIBBbleGbMvFhi52AslVmsWNY4q4SJLMQBq4LJVCk6TNmlMG2XmplAR5jtLYM5uwzm7TJYsMtgZW85rLLLYbVdDmvs8klrzQ8JLHnrya85J/OxRWZ5x4YHlXkKAQGXgBbO0qVvxrM4AfsoAJ2G8w4SABYBgU44rS8AeGGkO7LsahqRRgcxvLg/tPTJRAb0dERSDD9OgF/AnAnOKCa2MDE8lEWeRC7Sb/gRYH/sJ2AGrROCFMaoWg082nM73cRYJyFW7bjfoboJXpIxVmm9cmW98w2FNIQUKKe7DVP+h+snhVuSqd4ERAPaGqUh5RaUTWhujkpeQKMYJPk27eh1muiA3BDxJjYYmZGgetSDWBqlUNKnwlNt+NYzp8Ici86LZCj7ZkPqyrqueDo8vOEgeznafFOvy5MxDQj1ycp5wGk+ByiLa5XfS29m2rzu+rTy7zrTEnUAJNnEd5j4RGloxslQ3WfCDrUhRV3VSQs1RavDEZ6wauv7ToRU/uISkGLAkuns12pXNH0PsqrmdvXP8i+73qVpljvIzP9FDSxhdZ1WAQk5g5T29tZ5pISdgjJrSs+xWmjzNv8Uq8Vuh4t1nT4JCEVKNIuzkFLjCI5T8wwpBVbrJ2QYzCVWLjdd0R1juaeMpUc3q5ERbYgncMwvTDbLD0Ii0kRRb5rxSNYzavk02qzLeKMXxm4elHRAqPHpWosCje5lGeMUdMXNw2RN3KZcUbJQyhAeZLnjxO28s8CHjDaXSma12amXT6fIyZF1Pj8xw+vDeHqlya4jJ5gGhjqP2qzwKMsYgmdvUqDM3s935xpcKI/PcBJY3NqqUVqf+ud6OezXN5vgiqgMWhkd9axPFm7o0ZLQBK0gs674U2Qlnig5QBqOT9lk5Yh/+gWENNSQmRSUb1REBKc2S08dpRDTRJW2xMC3KyGSoqkensNnKCYkqQ0zl0gZ4zBOlCMc11AlQ0+gyjqhiO5xDX8NrcFNGeI7degfbbaG3UZQ+6eXhpw3R7UxjVBR2NzMFdcwojhR1+Q/MpZEODKH91WnRr8JwMhME7VBzh9mNI8qtyB0N8UxuLF2CdWbmsDgNHXi/yvr20CZ9htelV6dUB4/LVbgGKhZVr2uTkDcS7qHN0I0sxSHMq44h7d5GugXMo929eCDF7L1rOmKJ0PvlnLqPWUovEoCZJge9DkWd6XEwow6vpJ1xdfZp8NNlD+KoBdAiAGGeP0S82iD7sjNe5gXlB21A/htO8A49Ojf29eP/nt352VKOl2QfvjYL6OeVWtzcjckdFagJO4dwcCr8UJQbJhvYraLjnJUp2TYO94fjDvljGbvhgY675GlTb++eU2SrEIGaX3BVsM5kkonTm+fSh//AOJjDu9fIGb95aXM6Y+rUGWYNhRGQOeJOpV0TpiKFLpvrwP9S6V5ga+CGQmby+rHrV7VQPL5cGF64Wa9r397VZ7Oj5ks5ViO05MMnV0KYRhTX+7mQgkuPC959HDe7FQb/3t/RlCnEi5RdvWt/pZr5E89hVdu75tqbm/LvmXr6h9MdCnz+yOs9/ZfKESuu0RQUYE+J2ULolT8yOCOEflMf17yeeDnHdTdoUsbzbooxnESZ8RARqM5dKm62wdeXU9ynj9hqjcQa84q1uqDOnW23zzdH1aeyp9yKs9v6p7whpp/VeSHvA0bSfx+0PDk9W2WiJG++/1H0ypSCp+GqZI4OwTy8eCHIx+PfDKIwpyJcgg0a5/TFt/0uVeczN9e1MH787L3Pa6PC1QZWGgw13MgZB5+1Fkvfem+rCzBK47nN6cEE4z2/NyHcHMnBvaxkgvu8ihthx9fD3F1Hu3L/EHk3qqUMlPR32HaD42/722+25/l/HeYeslL6V+eQ5rViruoIvOrSzNzjSpCtH0tj+06RJb8f7LlSt/lMD5He1vKohmvycw1BTajvR4VqbXK5KX6U69k48X9OVJHYFeQYa97U37xP80Rck2GnGyVCmqlarSTf5d9yjEJp30+sR702bU8SslqlyyTxE33WYhdqhONzyOLY/1nUseDm5mgzgDrz+knht5L38+47WiT6goka7K8X/og7YqX1t6z7zqK+9eLOlGDt/G76QcZ15JqqXaB7pM+Sl59e+OFf/50NIHWCJvmPiVRYPqO/vRN395U8jSl9w+k1Uget8IvTitOBYViIKAA+hCt7A/0R9gpOsC4l6klMLBSIVdk6IrTBCjK1HzKKXX5eoOLzxG9XRtFUgoXsGJx1l5k9uQ7JJkk/vAPLz556QVptVmv0oTAGVJVXvbH/OYPXnntyLaKrj735/41O9vrdjkjdJ7/Y1HJojSBsk58/aeopY+d+TiBTOTx3prxd+g28c+fCDX/tDVouu0af8tV+UFuUHg8Fe2yI38Pg3tgv6ioWrIaW4KRIBiyUx3SRlsFzWnrFFa2FH/nVyFV7tsl6XS3ndbUtr1sno7z/zwksijxOOhe2Deob1VuUiHzwNpklcYLjyQgPZVnQsb4PtG5svHWHac33SYZggYdBJdWR/QOTQSxDM6jYknWHgO1RMYh2HSFqCrZn9D66Zkf7QrcFRh/23e175pw/vrJLy7dC3uuFVTb6Dl79Ae+OTir3/IRLpD3iyQh7bT7935+wOalTGnZoj5Vovyt3zszhI69y/xvdO7NVwmSSbvshRxW4sG+rV2k36qTZovAxrJ7mD7jK32o59ekXyuds+Evm+o+Dpq2tpy6vSlWvoVnJFZnxAk0Svoda+gTXZ5G4y3OkJZek5bC2cTT1zbiEPvOtpqCOm3I+dumQN3m+K9LJCPS+Ia8M17dQ/iF2IzR9gyb9m8jOol+5BOU3ra/D/Zo13d34WPKNUP8jj2vOolOT5Ubbt1AIXpu52PnUCA7ANDYBmlUDDHuwzf1LR2f9xHKIhBrwUMagjNHS5QIUk0kg5ZVWohUIk/1EjFiwSiyOsFSX1FL7iyMieeQQGiakWWUKdiqBkvbmpqQ8Zw08FIEyYEUiCVIFSsN2MILzj7CGceLeNm4SYD3tbvEah/Rlh3gReZ3AIDPH7xKGV718EXH0hRz9FMA4IEAkGAAw0Xoz0PpvqXf639GaVOXo1DUj61wtMQkwD/b7IzkJHiiRlRHRgHHZMOFQEhFRWhpL20NCMDhi7Z5E/M7zEfbUT0E3HAHZhpNkIF04m/cIboGKyEDQFxRZDbiDsrC3eAlPJjByjAfZ8O5fdPxRCbPboQvLv2eOgj6QnLMAA5A1GD1Ej2moDtHst5Jqq+gp1PigsYg0KkSLoIInS4BBQy6DJhEXBYMTnc5UMNVrbTAVaMdbnc1kBS+aJUEWDqfkX5WOOlm3JdwEeKiy1wCGnKPy0BD9ITLQna05HKQFGe10sFVkzGm0tWAI72tVRq4bo3/tEA2kveVitQfIG7t7K4+7Rz7i3rqYkubY4JHbpkIzX3fwlEtoUCsd+S7PyQcP2mGvscFbuGq8VjJnS1WuURGSRROjfJUV7S01fJcEoeaF2+eEBSUfbae+gbkp0Ib+j5c+4o83RWlno7FQ2OMOmtW9mrxOqdTjagb4JqKq7/Ze2Bydan3t7V5vZjW+Px+3u/1fafrKLb6LZe8OqdtlifGTRGn5N+I1Q+tidWdcmhNibK7kvoDDvBrZjoe3ML2Bl/RNwS15i3YaJVJ4yasIcsVkUdWxMqqWGFU22SsrE7MamQ9x8yPjcV0RGlzyHjDrbNQst7AxsE8ugVkQmxZ9UhIVGbO2qhFSMDZZq8RfpM2VXHoEmuvtNaMkFUazJuzJqJXJUxMiLGofEtKyEw6FC4XBZruds0qI1jzBSvLzWXpMOZlZV6IUaHM+strW8wKWWPClJANLJVeTyrkmb2eyMQ0WltoXlu0NgtCzaRiRjaZWW0ovU6dEiW7aKuyNiGzzbmFGo9WJvREqH01qfabbEyvP9mqhIyiZwwTMRxbDdF+a01UASOrZGLktV4+snYLyGuzbvexAHN9N4ONbpRqDQWfLQtZR2ayoThhM62yUUxIZKFaZ+LcNUooHYRdLzS94imsFnGcXmB0jEV8asbMj/8V2jXwEeUInE9w6WBFkq7+dT8pEEEFehUqVRk2Ggh8Dl8ggyzchhxSVDxIKm2s43o+CMEIiuEESdEMy6nUGq1ObzCazPHPTVqt3hp5avuygW9yJhr7nSApC4oSD4hXeDv0vCKKJLJd8F8oEDZRJOzCIZzCJdzCI4pFtagRtXZdPBBKdyaIQrreeqtgrctszkWsYhO7dSxraADWifpXa4CWD17v6t2NeH7fIn7mbPa1G2jNboB82Dl/lycAQFi6M1D3LsczO3sXq87sdSHKsyue5HcAsrF8JNCLo6d77t2gyn8cl3b2vN2kLM9F6wAA) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABgoAA4AAAAAKwgAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAANiAAAAE4AAABgRuZdBmNtYXAAAA3YAAAAugAAAcoB+528Y3Z0IAAAFIgAAAAKAAAADAAAAABmcGdtAAAOlAAABYwAAAuX1RTb8Gdhc3AAABggAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAArKAAARUELbjX5oZWFkAAAMoAAAADYAAAA2EIN07WhoZWEAAA1oAAAAHwAAACQHMgKeaG10eAAADNgAAACPAAAA2JZiEF1sb2NhAAAMMAAAAG4AAABueip1+m1heHAAAAwQAAAAHwAAACAAygwAbmFtZQAAFJQAAALAAAAG507M7Lhwb3N0AAAXVAAAAMoAAAHIC8Bi1nByZXAAABQgAAAAaAAAAH/i0Eg6eNqtWAV4G9fS3Zm7e1crraQFyUySbCu1QxaGoRhDmL7Gf5lCZW6dr244KTMzM7eBnx5zmZmZG7a1eXN3peDj9/Zq0aNzZs7Mzr2WhFJKkqTfYlRikir5nuIySDi0NW2mzWTaTKSuPjqVwmjhqxQ8JoH0TV89buKvStUSfyKEMLRViqiJeLI5KZkG5PK5dLosonKGpmFb5WRpWMCTzkR4otJG0+ShNUeceuoRa/paOQc2GL5h/8PWw7d1NnBuf+r8xlldeKPwurPa+c2nxBUjrhbiqhVcQFx2Jp1OlZeVSwZwNcETiXg2k8/ZlmkwTDbHbF+QyOAJZ2KSc1XhpnnvIUuXHnKvyf+kEZtjb1npWIMZ+Fn0BSiHldiB7bASyl+ISsQ2rK9e/hWxRYgtINgglyqLRniUSypPxJuzmVw2J8kX+6tsgL6HUTN0C0Cexn+vmzrIoG5YIutWQFwFFkkAQfJ+POGphAeSwDNj0YSZjkIQMl991VcfeKZ9w1vtuzBHyTKIbpw5EadUHhEOCHmlZCY5zNRtFeVpAJZuaNj3MABfo1u6vGGJSqwBugosUgEJUemrh+FFbuYql42ZsWzaVCDj/PErflH7hvb2QBNZXkpeXkWWs8hyqBu1mqBs0jCZODYnB8uZ7CjMZcZgPkcJzudtg47uVbo8GqVsc5WGaYijWlbuDtMQRzGiUcKPWT0HtlFoyHx293jkwOgSZRzfbfsYAqpGy4LYkLIY97dNr6jjAIE5nZNHDqionxMA8HdUxcqr/H1NXBs9t+O/dLgYLjPqaib2thACU7giKwpDRBlaeifW1JlwGVykt+1zwuTKygA3dU2unpMZO0FzepxFWu+CKcnGukh8Qa93f1Z3rCoSkjVd2kWLaaTF4GIeRmIpENOig/ikymqQxylY8WEibDFUr0Q8acySRM1FLQ1Skj6XMi1gRAY2nx/jDAGU0JETUAVE4GzCkSEFABmvPDjfGQlbnPF0spvC12ZHk9khbelkdLYGoM6frCL/P0P1l9UevipSpTunOg921M6+ahAqqmKQGjjoqtm1Hc5Dzil6VWTBzFyzn5tBVa4deNQyDZbAUu3ceVXx1vKK1njVvHM1WApLtKNuGSJzUmD7j9imnsAmShWkgN+thsZ0Si5PiSwn4k1NiiyKUbx08By8rCN7VOUy19BpdQbR3gKaygDwg4WvMj+WxQ45/PBD6iPkEpC6iAeph7C8NIywa11st8jFSKfyuaZcWqhLTF5FCSJXtERc5QpPiMt8xi1BPKyxfMLgjvm9U5v3aR66FsrHy6CACgnjmQPfumpUqmNu56xUY8uAgWudT8fJKENAbjTWHngDy6Kmt6Y1WbZnRsi+vk4BzdZy5jB6XFvJS89HaH6LnraQIlsuwzYp+A8psu2EHYoo/r+piK26imy5DQ/a3v8fUWSb01h+0JC/psjotn9UkYbav6uIdGJfHeunt6RG9EkmvJby5HdZecTtk9lMElmGq2oyny+zLXgDCqAE1QAUXmIsqhtdSxoMo6prIsw9pn+0/wIW8KvqhoVMQ5wDa3ALjmuIVV13DRTuKtwjFbvo2cSm7NpFYyYEYaHzjtdDL5eKHe9kYbdrx0uYCixsd7td4IS/gpYmPAi2Q0KAbbi8fS+sklUWBrQ7V/bNDZxAvZOwEoWTWae82J0Jgy6WSBUi49FIMVvN2VzecmdFdgD3/+EXYdHzWvdDBVh0CixXfWDJizmTQ857BcPhN8YadABAK/3da6wC3tB8IHi2b4Lb8EipknjCSDxKnMe9WshmjbzQPlVG+kfNCNwEVnUwxxggyLh/IBoEGTQAYP5zHoLBTAaIH+vcvdL1voe8v0h476FCaR5nzUy0MVGJFFC5ZZWXsU5u2uBTnSsPbZAFcivFYdb/8kF/YRnj4NNgHT6/EYalLQQAvWHDi87cwuoNIdKyvnAyHkQq1Qqe3eZwu8zeoZMoGhQR1ZuBEBHBQkGk4H4uUc09l9U3MPnMADE5BxbaNju/KzH99DKchhO+yrQqEsDvtm/Cg/4xpXC/f1QpiqCHIvCUCkkiAqpx0dwtOycuPKG4ikDRDKvkDfWX3VNjKjgs7+XZOYfyXOjRmL818xW2w2kvbGxhxSz3f+4kvSyPLZyL15NOe9b5WOh2thbOVdUZWydKwo4OV+AciZXsYmaarGbgnMLdkovTQzhL9qxwsgC10KOqWyfOoJikwrnQLdhKFW66bwt0z5AHz9iylT9BSCrBde/FpJaYCKOHMJbs+ZaQhXNX4Xn+xJatxAS9lJNn2RIpQVZR159y0TpFQxOnSJQG3RSzlPHWFfhbTmJOPMYAGQCMlgyKPOlXpfYPsiWiFLmcvecYYDWXyoHhTT+ijCJxH3yjrb90SLNKvt1fWAhb5JVShlhrdu2sHrdaWqaI1VWCF7mTSMfmTLGlki+wDMft41IHDh87J8R9iw/IqQAy4Fz3qbFGB9APniuerXBr550vtJvOmz5Mk5UpS44+Sfvi0ZHu47e/1EFdpSHEAbX9nj1P//IjJrTpX4TPSn733QjutvYqVqvwkPair/gsTwRu7GrlRMcyLQbQ5jPaFqkc+pdwPuP6WYf410AtykCC/LBRHz/0mlkyB9vLAmyBnLfC3F0PrpYEKAUsgxejewFZ2v3hZWcMAO/iOhT6CjzKasOOt5oW/rtKmogLRDcWD/sRNM3A8smjPf12954tBt7ee9Jc7ZsnRgnff9xQ8t2yJeF9YSE+K7K55zwp2pOQqDRDety7lVLJAcMLbq+8iTj3zvCKUtqcrbul7ZGRfyHN/qegAiWhSv8i2EL5bCyp0rRH1ZEqnl85KjLaszRyO/1SR09aETBsUfuTjgkL3zQoFvaJc89v59w2ReXfezRg7cU8MKLpB1nMx/0X4KfsHqmKWMsVoU5ITlAdMaY2J2kStmzbtIUj+ClwJD/0msrXXp7J1eDEiUed9Sb4Nd3Xfx1wZDhjEq7CJfcrvuANNzqvOFcXFuCP+GMwTCwX9jXg//FX3XWQ7SOWfNa2KIaUWKREo5Qp1ftPhV24aTP6qIljKOJU/LQJbCOi4+YfLXwX32NBGeiBtm1aIVlo0QzbZPgeoR9H6NcRehmhB7weSy07J+WBBBIa2naUocpXG/ZUOGCaU2GHI0HcvImo9L4GAvyJ/e4n5WHNiFisECvELTrEmCkB/i+taT/FkyWNkBWBLMeTnhwmvlelutGHQpCCVDBcuFnyviFn8BApQN/Q0K22fIxKLGZSZeH/yjrMDoedn6lVKk7UZToV/hAKSbD98+2t8EfpLHee0ASTmsy6NZhyI3DXi26V0iFhcV9X77GLmCWbCICGpZ2+brgVkNXwKzwRWtY+RgNOlclBnT6hLMKR8DcR/puEL2Y3XSb8ZDaT9gqsPCpKy6t0kQO/IgeWn9Hb5eNmWJXrh83sGTPCQBhVV4MT2peFEhz5sNYDKoIchd8U9B9houu3DYTL8m7n8cYO1130ZIWLGDQqY0VMwPDsw4ZWEBccRLDlVqxSAAvfG6NhIhOeE8ObxCBWjL7iHCBk8GDdKVQIJQYFBC8LbSqGHjY77EnjX3N6rNIIyogWTHTVCUcbPXUCh1bGrHIKo8hyPemzY75KZGNRP9x51lmShBJtMFA6uvgbh+L9xtGWTUfTtB/tbf+4HUhiO5pGic21EX/7M1+qRNkAAHjaY2BkYGAwYwhnYGIAAjApwFAOJKW4p4MEABiYAdYAAAAAFgAWABYAFgBMAIMAqwDAAOkA/gGEAgUCBQIzAo4CvAMXA04DYgN1A4gDmwPPA/oELgRkBI8EwgTWBOYE+QULBRsFLgVpBbwF8QYZBlAGpAbfBxIHQQduB4cHowfTB/8IMAhjCHIIhgiaCKgAAAABAAAAAQAAdWBqS18PPPUACwPoAAAAANiymQoAAAAA2LKZCviR+x4HbgbWAAAACAACAAAAAAAAeNpFxiEMglAUQNH7/oOR6DZxbiSTyWY02TObm8FAJmGfAbPJas8Gm713isXgHEF8f0x/OLuXjjmArIEOdMTDTKIPC7eSdCix5jQeHSRF/0wKHLyP5qwtpasldTXxr7qTacDYevd1J1kGYE18tZK9VlyGhveNMkrNOZhtlLmrJ7e+Na9/GzMDjw18AXIuNDMAeNpjYGRgYLv2W44hij3xx8T/L9jzgCKowAwApaQG1QB42mNgYmZlnMDAysDA1MW0h4GBoQdCMz5gMGRkYkACDQwM7wUY3ryF8QPSXFMYHBgU3v9nVvhvwRDFdo3lkQIDQ38cM1yLAgMjAPoPEIIAAHjaY2BgYIZiGQZGBhA4AuQxgvksDCuAtBqDApDFBiQ1GfQZYhmqGWoZFjAdY7rDzKwkpcytvFZ5u/rLB4wPQ97///+fgQGoTgOoLhpJHRNQHYfybKC6Fw8YHga8/wtU+Pj/nf/X/6/53/+/73/OX/e/Rn95736/y3Wn+k7RDScFHbl7AmZAVxAJGNmAGMZmAhJM6ApAXoQAFlYwxcZAPGDn4MQrz8XAzUANIAiheEjQwssHYwEASs00MAAAeNqsVeWa48gOLYeaYRh8QZ6a9O2blD3MbMfJ8DR+n2vRbvq9vPsMfho5y//20fbISXP3ckNUpVJJR0dShZUhVqtJbIle/aSmF19xY/m9hG+6PG/TLcpXE640s59H1ahaX9drruexsqwi3ekrR0Vp6LNjmNItnyuGNoh/WeDa3Hv9eWc8itfjpfcTT3tunhAvLCQeP7Uu8V1Z3bWWioFRtsHzUA13xFfl/Cos4SwhgMgz4vGFJIWG5GxcVrdldTt1U2uty07bWs1qIdm01ueqIfipNTMAqkcLCdd1yA0dAr5lJ/W5ZjRw0UZRXwtJTgbB5ZNVGq9zteVBH1FOOXwXV+tNpLWYpAtutmQTbXH6dDnBkYuktiP7XDc8ErX7qjKgpoGtDjWx0mHGlbUtdtYRn+stn0cMCciJaP2nmloj8cBPUysmaacEOWr6IxMqisOWt0P2mNlP/njpBTg09Mg4pTjXGW0MmVKusMnkAuQ2Sq42ddYZhJg45jpfxi2FW0ddmjRlQv2J8WqceK72bMvzecoUlUrMG1nH52kDQyKejF7KdSx0aHlKdkvYTWHn8wzczJaUEBhYR1yejlLKU+JpkObzrHm1khS1jY69zFOb+hufT5hXi8mr5YHS9aA/VepPmkLNRKtJMTMTsZOFPNOWJkXrhsWkfEzhg52zmpDHQlIIecg2zHMqw7Y8jWvba3dwjiv4LzUWmfSAvwft/lIdU8BCqVMabEWsHvcdxylrdcqoQlXilYRndEgxT+iQx8FvGlKK8N/PzjpqWoVhnhYnG23+su1eAk2nkdupts9nTOGIPAueRZ4zRVXkeVPURF4wRV3kRVM0RLqmGBH5L1OMivy3KcZE/t9QwM6HPrfKxac+t8vFZz7/xyieav8FjP8Fxv/ANwGjSA8YRV4CRpEaGEVeBkaRTWAUOQeMIv8HjCLngVGkMfSwbDXfIOxsSpHGNpJyQLKRfgsM+232MUlXDFGPjqmEzu5qecZ+0wKt5PPVnfI4Z/lKq6g7Z+Lkqi0TvFYyc+zxdUO3Srw3YOfEh4NgwhD8aL06+52Sn85jfbe47pxBRjeRP/WOwcsqyu76fMsE5x76fPv3TNmJ1mF+ByVRZ5sUUI+Vls5+kec93dMZJWvInx1M9G3HOXMa8e8aoMKA4K804bGovZkHmuhhDl/3do8pGPjgmg7FijiVeX+6mHxboSq531bmqhdtKG/gaES5Lq11F9OHah5AS2Bj8NhXonRDczXKNhYSbDIX61TeoIN3Mk0IPae7qKFGhC7ygiijpHRUEC1RNE5SSK6joeqHvMKjZNQsQeBzYfDK7cZCye8LBwRNfW7IgX4Iah6IGrnqEGdd3ZNgUq2Hoi8TGDKqVpKAHmrPhWZbCWe7lDea2L3Y++07KNRRHTysjJY2fjREEG2XJpWv54MpbpfysdEUCGtdPMwPbVAEzmkM4JMd9cJe9dP91kfaPDN8t32k09DwvXaOwNIsQHvYBmUJOIBptNNhYHenBTVaPdB3h+46eDTwhv+FVuz9U90n8LO7gKXxhOypt2eHGGMhYzv/ruTv6SEB+u7+lHtI+cxgOPtK5vBUwDcxi8+P0b8whXJOn+JbWL80fAfilbAWg1fq5kDxa4/1gBxBAARQNMY9UkznArG9tjlr+1iDC27/UfF11R/T3+y/cDuaf8qI2PqeUUQVhyAm9uEBiCsOQYLmQ5GkASkakKYBGZoXRZYG5GhAngYUaN4URRpQogFlGlCh+VRUaUCNBtRpQIPmVdGkAS0a0KYBhpi34WnuMJiPqq6rJ1WPM8PwrENfzLuwHjC49RC59Qi56VjM+zCdMLjpFLnpDLnpXMyHMF0wuOkSuekKuelanMuTo+Dn6fXavDDM46v4Lvim3OwBEWxNYHjaY/DewXAiKGIjI2Nf5AbGnRwMHAzJBRsZ2Jw2MjBoQWgOFHonAwMDJzKLmcFlowpjR2DEBoeOiI3MKS4b1UC8XRwNDIwsDh3JIREgJZFAsJGBR2sH4//WDSy9G5mAulhTXACYSCQbeNpjQAIAAAwAAQAAeNpMzLWBQmEQBOD57Q53D7EGIMYhfzkRVgoVoCFuFVAKdZDjg2z0rQ2AiPBA4FUWQAs4YdES/2jSCim0aY0g+rSBG1P672fuFjmsaQ8S4kT7fvL9z3wFoe0A5uJMC0TkkJbwyAOt0JBHWiMrr7RBQmXov5+5W/ZUkfYgb1a07yff/8iv3lqjiiXXYSDYZ3/F3B45CtQyMzPftrTObKyA47IU/Po3UZaZyqB2u0HQTHuZqcSOfkd/qFQoTOZKhWKBVtiaSkLHkeEk4pA2k0gFT8XFkYF4grZjndBipMvc6G3rE764PDZ9HjniSquus7Vm4taaWYWppAo0RQ8UuRvJC9QZZ9Y0Eyqoghp5ZZbhi9Ok3zOdTkc1tIuruqukee7Ph6Z+Y6wJpYfM0BwGHeNiOmLLWZvLNFgQ7ekGP1yKCoKT2Njhz+PmtevojEmIuok4sWJrJWXOyMVMx5s7tJ9yMhTvDAUh3S65qIpKwu69pNva1PVVncnPRNPa4iFpNxXEzqVT+byNMpM6q6ypD6ac31/bef0PltFEih4yGFQQw4HwGxH+yFhCQa5J5DwqykNYAcN6bSJfx4gEs+BI3qEwmx4rBO8mFzFylzwh3LZotE9dRCSoDEZD/NuCTwRf4FL6DPqCR3AEltQW6tDSsCZdCZwfM+HZdyg/4ynQKxm5xykfVJ2B5W1hfCdJh/LPyCf3Mvz4bvqcGXT8pdCAhpP8qoxdqJs1z+HPD+7648bajUo/0jxsDhGI0vh5kd8x6/epDRY93Z0QYQ9a3PzqqShJCoSPhbGPnMeCrgV1xJf5hKGiLmPk983etLUEl30/+Rmxd29iR8Z9pF77MHnnUUIIenbKRSj/+Jm92EvQaMtjhNe4krdwD/ZE+8ZFHHrsMIVAeCdXKjgvl0UknUa+nWAlj2Td7XIe++Lf+YrnPxKAWPF42myKwwECABSG35dt23XL3dIg2fYEzdJOtUw89/hLFPKr11VK8q9qn+WTUopRTOKQhjSlJV3po5C7PFCikhtqNGjRoceAERNmLFixYceBExduPHjx4SdAkBBhIkSJESdBkhRpMmTJaS/bRaHQLvx+uVDSnxfr8WS02wy/yruluDYAIIYBIDZSmLqA7f03ejw1isl3Hrx4/4/Nh4WV7X95Dhw5cebClRt3Hrx482H53+27aefxrt57Dt+heA4cOXH+NhNWthvTfGCxAAAAAQAB//8ADw==) format("woff"),url(/static/KaTeX_Size4-Regular-1d1325964eb3838aa3086bb34e36a1cf.ttf) format("truetype")}@font-face{font-family:KaTeX_Typewriter;font-style:normal;font-weight:400;src:url(/static/KaTeX_Typewriter-Regular-4f31d033d446bb37ed6054ae5d39bd22.woff2) format("woff2"),url(/static/KaTeX_Typewriter-Regular-d3c8e68f425df650554fab73fd14628f.woff) format("woff"),url(/static/KaTeX_Typewriter-Regular-b1d1af1a936d0174df3012bd14c56561.ttf) format("truetype")}.katex{font:normal 1.21em KaTeX_Main,Times New Roman,serif;line-height:1.2;text-indent:0;text-rendering:auto}.katex *{-ms-high-contrast-adjust:none!important}.katex .katex-version:after{content:"0.11.1"}.katex .katex-mathml{clip:rect(1px,1px,1px,1px);border:0;height:1px;overflow:hidden;padding:0;position:absolute;width:1px}.katex .katex-html>.newline{display:block}.katex .base{position:relative;white-space:nowrap;width:-webkit-min-content;width:min-content}.katex .base,.katex .strut{display:inline-block}.katex .textbf{font-weight:700}.katex .textit{font-style:italic}.katex .textrm{font-family:KaTeX_Main}.katex .textsf{font-family:KaTeX_SansSerif}.katex .texttt{font-family:KaTeX_Typewriter}.katex .mathdefault{font-family:KaTeX_Math;font-style:italic}.katex .mathit{font-family:KaTeX_Main;font-style:italic}.katex .mathrm{font-style:normal}.katex .mathbf{font-family:KaTeX_Main;font-weight:700}.katex .boldsymbol{font-family:KaTeX_Math;font-style:italic;font-weight:700}.katex .amsrm,.katex .mathbb,.katex .textbb{font-family:KaTeX_AMS}.katex .mathcal{font-family:KaTeX_Caligraphic}.katex .mathfrak,.katex .textfrak{font-family:KaTeX_Fraktur}.katex .mathtt{font-family:KaTeX_Typewriter}.katex .mathscr,.katex .textscr{font-family:KaTeX_Script}.katex .mathsf,.katex .textsf{font-family:KaTeX_SansSerif}.katex .mathboldsf,.katex .textboldsf{font-family:KaTeX_SansSerif;font-weight:700}.katex .mathitsf,.katex .textitsf{font-family:KaTeX_SansSerif;font-style:italic}.katex .mainrm{font-family:KaTeX_Main;font-style:normal}.katex .vlist-t{display:inline-table;table-layout:fixed}.katex .vlist-r{display:table-row}.katex .vlist{display:table-cell;position:relative;vertical-align:bottom}.katex .vlist>span{display:block;height:0;position:relative}.katex .vlist>span>span{display:inline-block}.katex .vlist>span>.pstrut{overflow:hidden;width:0}.katex .vlist-t2{margin-right:-2px}.katex .vlist-s{display:table-cell;font-size:1px;min-width:2px;vertical-align:bottom;width:2px}.katex .msupsub{text-align:left}.katex .mfrac>span>span{text-align:center}.katex .mfrac .frac-line{border-bottom-style:solid;display:inline-block;width:100%}.katex .hdashline,.katex .hline,.katex .mfrac .frac-line,.katex .overline .overline-line,.katex .rule,.katex .underline .underline-line{min-height:1px}.katex .mspace{display:inline-block}.katex .clap,.katex .llap,.katex .rlap{position:relative;width:0}.katex .clap>.inner,.katex .llap>.inner,.katex .rlap>.inner{position:absolute}.katex .clap>.fix,.katex .llap>.fix,.katex .rlap>.fix{display:inline-block}.katex .llap>.inner{right:0}.katex .clap>.inner,.katex .rlap>.inner{left:0}.katex .clap>.inner>span{margin-left:-50%;margin-right:50%}.katex .rule{border:0 solid;display:inline-block;position:relative}.katex .hline,.katex .overline .overline-line,.katex .underline .underline-line{border-bottom-style:solid;display:inline-block;width:100%}.katex .hdashline{border-bottom-style:dashed;display:inline-block;width:100%}.katex .sqrt>.root{margin-left:.27777778em;margin-right:-.55555556em}.katex .fontsize-ensurer.reset-size1.size1,.katex .sizing.reset-size1.size1{font-size:1em}.katex .fontsize-ensurer.reset-size1.size2,.katex .sizing.reset-size1.size2{font-size:1.2em}.katex .fontsize-ensurer.reset-size1.size3,.katex .sizing.reset-size1.size3{font-size:1.4em}.katex .fontsize-ensurer.reset-size1.size4,.katex .sizing.reset-size1.size4{font-size:1.6em}.katex .fontsize-ensurer.reset-size1.size5,.katex .sizing.reset-size1.size5{font-size:1.8em}.katex .fontsize-ensurer.reset-size1.size6,.katex .sizing.reset-size1.size6{font-size:2em}.katex .fontsize-ensurer.reset-size1.size7,.katex .sizing.reset-size1.size7{font-size:2.4em}.katex .fontsize-ensurer.reset-size1.size8,.katex .sizing.reset-size1.size8{font-size:2.88em}.katex .fontsize-ensurer.reset-size1.size9,.katex .sizing.reset-size1.size9{font-size:3.456em}.katex .fontsize-ensurer.reset-size1.size10,.katex .sizing.reset-size1.size10{font-size:4.148em}.katex .fontsize-ensurer.reset-size1.size11,.katex .sizing.reset-size1.size11{font-size:4.976em}.katex .fontsize-ensurer.reset-size2.size1,.katex .sizing.reset-size2.size1{font-size:.83333333em}.katex .fontsize-ensurer.reset-size2.size2,.katex .sizing.reset-size2.size2{font-size:1em}.katex .fontsize-ensurer.reset-size2.size3,.katex .sizing.reset-size2.size3{font-size:1.16666667em}.katex .fontsize-ensurer.reset-size2.size4,.katex .sizing.reset-size2.size4{font-size:1.33333333em}.katex .fontsize-ensurer.reset-size2.size5,.katex .sizing.reset-size2.size5{font-size:1.5em}.katex .fontsize-ensurer.reset-size2.size6,.katex .sizing.reset-size2.size6{font-size:1.66666667em}.katex .fontsize-ensurer.reset-size2.size7,.katex .sizing.reset-size2.size7{font-size:2em}.katex .fontsize-ensurer.reset-size2.size8,.katex .sizing.reset-size2.size8{font-size:2.4em}.katex .fontsize-ensurer.reset-size2.size9,.katex .sizing.reset-size2.size9{font-size:2.88em}.katex .fontsize-ensurer.reset-size2.size10,.katex .sizing.reset-size2.size10{font-size:3.45666667em}.katex .fontsize-ensurer.reset-size2.size11,.katex .sizing.reset-size2.size11{font-size:4.14666667em}.katex .fontsize-ensurer.reset-size3.size1,.katex .sizing.reset-size3.size1{font-size:.71428571em}.katex .fontsize-ensurer.reset-size3.size2,.katex .sizing.reset-size3.size2{font-size:.85714286em}.katex .fontsize-ensurer.reset-size3.size3,.katex .sizing.reset-size3.size3{font-size:1em}.katex .fontsize-ensurer.reset-size3.size4,.katex .sizing.reset-size3.size4{font-size:1.14285714em}.katex .fontsize-ensurer.reset-size3.size5,.katex .sizing.reset-size3.size5{font-size:1.28571429em}.katex .fontsize-ensurer.reset-size3.size6,.katex .sizing.reset-size3.size6{font-size:1.42857143em}.katex .fontsize-ensurer.reset-size3.size7,.katex .sizing.reset-size3.size7{font-size:1.71428571em}.katex .fontsize-ensurer.reset-size3.size8,.katex .sizing.reset-size3.size8{font-size:2.05714286em}.katex .fontsize-ensurer.reset-size3.size9,.katex .sizing.reset-size3.size9{font-size:2.46857143em}.katex .fontsize-ensurer.reset-size3.size10,.katex .sizing.reset-size3.size10{font-size:2.96285714em}.katex .fontsize-ensurer.reset-size3.size11,.katex .sizing.reset-size3.size11{font-size:3.55428571em}.katex .fontsize-ensurer.reset-size4.size1,.katex .sizing.reset-size4.size1{font-size:.625em}.katex .fontsize-ensurer.reset-size4.size2,.katex .sizing.reset-size4.size2{font-size:.75em}.katex .fontsize-ensurer.reset-size4.size3,.katex .sizing.reset-size4.size3{font-size:.875em}.katex .fontsize-ensurer.reset-size4.size4,.katex .sizing.reset-size4.size4{font-size:1em}.katex .fontsize-ensurer.reset-size4.size5,.katex .sizing.reset-size4.size5{font-size:1.125em}.katex .fontsize-ensurer.reset-size4.size6,.katex .sizing.reset-size4.size6{font-size:1.25em}.katex .fontsize-ensurer.reset-size4.size7,.katex .sizing.reset-size4.size7{font-size:1.5em}.katex .fontsize-ensurer.reset-size4.size8,.katex .sizing.reset-size4.size8{font-size:1.8em}.katex .fontsize-ensurer.reset-size4.size9,.katex .sizing.reset-size4.size9{font-size:2.16em}.katex .fontsize-ensurer.reset-size4.size10,.katex .sizing.reset-size4.size10{font-size:2.5925em}.katex .fontsize-ensurer.reset-size4.size11,.katex .sizing.reset-size4.size11{font-size:3.11em}.katex .fontsize-ensurer.reset-size5.size1,.katex .sizing.reset-size5.size1{font-size:.55555556em}.katex .fontsize-ensurer.reset-size5.size2,.katex .sizing.reset-size5.size2{font-size:.66666667em}.katex .fontsize-ensurer.reset-size5.size3,.katex .sizing.reset-size5.size3{font-size:.77777778em}.katex .fontsize-ensurer.reset-size5.size4,.katex .sizing.reset-size5.size4{font-size:.88888889em}.katex .fontsize-ensurer.reset-size5.size5,.katex .sizing.reset-size5.size5{font-size:1em}.katex .fontsize-ensurer.reset-size5.size6,.katex .sizing.reset-size5.size6{font-size:1.11111111em}.katex .fontsize-ensurer.reset-size5.size7,.katex .sizing.reset-size5.size7{font-size:1.33333333em}.katex .fontsize-ensurer.reset-size5.size8,.katex .sizing.reset-size5.size8{font-size:1.6em}.katex .fontsize-ensurer.reset-size5.size9,.katex .sizing.reset-size5.size9{font-size:1.92em}.katex .fontsize-ensurer.reset-size5.size10,.katex .sizing.reset-size5.size10{font-size:2.30444444em}.katex .fontsize-ensurer.reset-size5.size11,.katex .sizing.reset-size5.size11{font-size:2.76444444em}.katex .fontsize-ensurer.reset-size6.size1,.katex .sizing.reset-size6.size1{font-size:.5em}.katex .fontsize-ensurer.reset-size6.size2,.katex .sizing.reset-size6.size2{font-size:.6em}.katex .fontsize-ensurer.reset-size6.size3,.katex .sizing.reset-size6.size3{font-size:.7em}.katex .fontsize-ensurer.reset-size6.size4,.katex .sizing.reset-size6.size4{font-size:.8em}.katex .fontsize-ensurer.reset-size6.size5,.katex .sizing.reset-size6.size5{font-size:.9em}.katex .fontsize-ensurer.reset-size6.size6,.katex .sizing.reset-size6.size6{font-size:1em}.katex .fontsize-ensurer.reset-size6.size7,.katex .sizing.reset-size6.size7{font-size:1.2em}.katex .fontsize-ensurer.reset-size6.size8,.katex .sizing.reset-size6.size8{font-size:1.44em}.katex .fontsize-ensurer.reset-size6.size9,.katex .sizing.reset-size6.size9{font-size:1.728em}.katex .fontsize-ensurer.reset-size6.size10,.katex .sizing.reset-size6.size10{font-size:2.074em}.katex .fontsize-ensurer.reset-size6.size11,.katex .sizing.reset-size6.size11{font-size:2.488em}.katex .fontsize-ensurer.reset-size7.size1,.katex .sizing.reset-size7.size1{font-size:.41666667em}.katex .fontsize-ensurer.reset-size7.size2,.katex .sizing.reset-size7.size2{font-size:.5em}.katex .fontsize-ensurer.reset-size7.size3,.katex .sizing.reset-size7.size3{font-size:.58333333em}.katex .fontsize-ensurer.reset-size7.size4,.katex .sizing.reset-size7.size4{font-size:.66666667em}.katex .fontsize-ensurer.reset-size7.size5,.katex .sizing.reset-size7.size5{font-size:.75em}.katex .fontsize-ensurer.reset-size7.size6,.katex .sizing.reset-size7.size6{font-size:.83333333em}.katex .fontsize-ensurer.reset-size7.size7,.katex .sizing.reset-size7.size7{font-size:1em}.katex .fontsize-ensurer.reset-size7.size8,.katex .sizing.reset-size7.size8{font-size:1.2em}.katex .fontsize-ensurer.reset-size7.size9,.katex .sizing.reset-size7.size9{font-size:1.44em}.katex .fontsize-ensurer.reset-size7.size10,.katex .sizing.reset-size7.size10{font-size:1.72833333em}.katex .fontsize-ensurer.reset-size7.size11,.katex .sizing.reset-size7.size11{font-size:2.07333333em}.katex .fontsize-ensurer.reset-size8.size1,.katex .sizing.reset-size8.size1{font-size:.34722222em}.katex .fontsize-ensurer.reset-size8.size2,.katex .sizing.reset-size8.size2{font-size:.41666667em}.katex .fontsize-ensurer.reset-size8.size3,.katex .sizing.reset-size8.size3{font-size:.48611111em}.katex .fontsize-ensurer.reset-size8.size4,.katex .sizing.reset-size8.size4{font-size:.55555556em}.katex .fontsize-ensurer.reset-size8.size5,.katex .sizing.reset-size8.size5{font-size:.625em}.katex .fontsize-ensurer.reset-size8.size6,.katex .sizing.reset-size8.size6{font-size:.69444444em}.katex .fontsize-ensurer.reset-size8.size7,.katex .sizing.reset-size8.size7{font-size:.83333333em}.katex .fontsize-ensurer.reset-size8.size8,.katex .sizing.reset-size8.size8{font-size:1em}.katex .fontsize-ensurer.reset-size8.size9,.katex .sizing.reset-size8.size9{font-size:1.2em}.katex .fontsize-ensurer.reset-size8.size10,.katex .sizing.reset-size8.size10{font-size:1.44027778em}.katex .fontsize-ensurer.reset-size8.size11,.katex .sizing.reset-size8.size11{font-size:1.72777778em}.katex .fontsize-ensurer.reset-size9.size1,.katex .sizing.reset-size9.size1{font-size:.28935185em}.katex .fontsize-ensurer.reset-size9.size2,.katex .sizing.reset-size9.size2{font-size:.34722222em}.katex .fontsize-ensurer.reset-size9.size3,.katex .sizing.reset-size9.size3{font-size:.40509259em}.katex .fontsize-ensurer.reset-size9.size4,.katex .sizing.reset-size9.size4{font-size:.46296296em}.katex .fontsize-ensurer.reset-size9.size5,.katex .sizing.reset-size9.size5{font-size:.52083333em}.katex .fontsize-ensurer.reset-size9.size6,.katex .sizing.reset-size9.size6{font-size:.5787037em}.katex .fontsize-ensurer.reset-size9.size7,.katex .sizing.reset-size9.size7{font-size:.69444444em}.katex .fontsize-ensurer.reset-size9.size8,.katex .sizing.reset-size9.size8{font-size:.83333333em}.katex .fontsize-ensurer.reset-size9.size9,.katex .sizing.reset-size9.size9{font-size:1em}.katex .fontsize-ensurer.reset-size9.size10,.katex .sizing.reset-size9.size10{font-size:1.20023148em}.katex .fontsize-ensurer.reset-size9.size11,.katex .sizing.reset-size9.size11{font-size:1.43981481em}.katex .fontsize-ensurer.reset-size10.size1,.katex .sizing.reset-size10.size1{font-size:.24108004em}.katex .fontsize-ensurer.reset-size10.size2,.katex .sizing.reset-size10.size2{font-size:.28929605em}.katex .fontsize-ensurer.reset-size10.size3,.katex .sizing.reset-size10.size3{font-size:.33751205em}.katex .fontsize-ensurer.reset-size10.size4,.katex .sizing.reset-size10.size4{font-size:.38572806em}.katex .fontsize-ensurer.reset-size10.size5,.katex .sizing.reset-size10.size5{font-size:.43394407em}.katex .fontsize-ensurer.reset-size10.size6,.katex .sizing.reset-size10.size6{font-size:.48216008em}.katex .fontsize-ensurer.reset-size10.size7,.katex .sizing.reset-size10.size7{font-size:.57859209em}.katex .fontsize-ensurer.reset-size10.size8,.katex .sizing.reset-size10.size8{font-size:.69431051em}.katex .fontsize-ensurer.reset-size10.size9,.katex .sizing.reset-size10.size9{font-size:.83317261em}.katex .fontsize-ensurer.reset-size10.size10,.katex .sizing.reset-size10.size10{font-size:1em}.katex .fontsize-ensurer.reset-size10.size11,.katex .sizing.reset-size10.size11{font-size:1.19961427em}.katex .fontsize-ensurer.reset-size11.size1,.katex .sizing.reset-size11.size1{font-size:.20096463em}.katex .fontsize-ensurer.reset-size11.size2,.katex .sizing.reset-size11.size2{font-size:.24115756em}.katex .fontsize-ensurer.reset-size11.size3,.katex .sizing.reset-size11.size3{font-size:.28135048em}.katex .fontsize-ensurer.reset-size11.size4,.katex .sizing.reset-size11.size4{font-size:.32154341em}.katex .fontsize-ensurer.reset-size11.size5,.katex .sizing.reset-size11.size5{font-size:.36173633em}.katex .fontsize-ensurer.reset-size11.size6,.katex .sizing.reset-size11.size6{font-size:.40192926em}.katex .fontsize-ensurer.reset-size11.size7,.katex .sizing.reset-size11.size7{font-size:.48231511em}.katex .fontsize-ensurer.reset-size11.size8,.katex .sizing.reset-size11.size8{font-size:.57877814em}.katex .fontsize-ensurer.reset-size11.size9,.katex .sizing.reset-size11.size9{font-size:.69453376em}.katex .fontsize-ensurer.reset-size11.size10,.katex .sizing.reset-size11.size10{font-size:.83360129em}.katex .fontsize-ensurer.reset-size11.size11,.katex .sizing.reset-size11.size11{font-size:1em}.katex .delimsizing.size1{font-family:KaTeX_Size1}.katex .delimsizing.size2{font-family:KaTeX_Size2}.katex .delimsizing.size3{font-family:KaTeX_Size3}.katex .delimsizing.size4{font-family:KaTeX_Size4}.katex .delimsizing.mult .delim-size1>span{font-family:KaTeX_Size1}.katex .delimsizing.mult .delim-size4>span{font-family:KaTeX_Size4}.katex .nulldelimiter{display:inline-block;width:.12em}.katex .delimcenter,.katex .op-symbol{position:relative}.katex .op-symbol.small-op{font-family:KaTeX_Size1}.katex .op-symbol.large-op{font-family:KaTeX_Size2}.katex .accent>.vlist-t,.katex .op-limits>.vlist-t{text-align:center}.katex .accent .accent-body{position:relative}.katex .accent .accent-body:not(.accent-full){width:0}.katex .overlay{display:block}.katex .mtable .vertical-separator{display:inline-block;min-width:1px}.katex .mtable .arraycolsep{display:inline-block}.katex .mtable .col-align-c>.vlist-t{text-align:center}.katex .mtable .col-align-l>.vlist-t{text-align:left}.katex .mtable .col-align-r>.vlist-t{text-align:right}.katex .svg-align{text-align:left}.katex svg{fill:currentColor;stroke:currentColor;fill-rule:nonzero;fill-opacity:1;stroke-width:1;stroke-linecap:butt;stroke-linejoin:miter;stroke-miterlimit:4;stroke-dasharray:none;stroke-dashoffset:0;stroke-opacity:1;display:block;height:inherit;position:absolute;width:100%}.katex svg path{stroke:none}.katex img{border-style:none;max-height:none;max-width:none;min-height:0;min-width:0}.katex .stretchy{display:block;overflow:hidden;position:relative;width:100%}.katex .stretchy:after,.katex .stretchy:before{content:""}.katex .hide-tail{overflow:hidden;position:relative;width:100%}.katex .halfarrow-left{left:0;overflow:hidden;position:absolute;width:50.2%}.katex .halfarrow-right{overflow:hidden;position:absolute;right:0;width:50.2%}.katex .brace-left{left:0;overflow:hidden;position:absolute;width:25.1%}.katex .brace-center{left:25%;overflow:hidden;position:absolute;width:50%}.katex .brace-right{overflow:hidden;position:absolute;right:0;width:25.1%}.katex .x-arrow-pad{padding:0 .5em}.katex .mover,.katex .munder,.katex .x-arrow{text-align:center}.katex .boxpad{padding:0 .3em}.katex .fbox,.katex .fcolorbox{border:.04em solid;box-sizing:border-box}.katex .cancel-pad{padding:0 .2em}.katex .cancel-lap{margin-left:-.2em;margin-right:-.2em}.katex .sout{border-bottom-style:solid;border-bottom-width:.08em}.katex-display{display:block;margin:1em 0;text-align:center}.katex-display>.katex{display:block;text-align:center;white-space:nowrap}.katex-display>.katex>.katex-html{display:block;position:relative}.katex-display>.katex>.katex-html>.tag{position:absolute;right:0}.katex-display.leqno>.katex>.katex-html>.tag{left:0;right:auto}.katex-display.fleqn>.katex{text-align:left}</style><title data-react-helmet="true">AI를 통해 진화하는 데이터플랫폼 근황 | Swalloow Blog</title><style>.gatsby-image-wrapper{position:relative;overflow:hidden}.gatsby-image-wrapper picture.object-fit-polyfill{position:static!important}.gatsby-image-wrapper img{bottom:0;height:100%;left:0;margin:0;max-width:none;padding:0;position:absolute;right:0;top:0;width:100%;object-fit:cover}.gatsby-image-wrapper [data-main-image]{opacity:0;transform:translateZ(0);transition:opacity .25s linear;will-change:opacity}.gatsby-image-wrapper-constrained{display:inline-block;vertical-align:top}</style><noscript><style>.gatsby-image-wrapper noscript [data-main-image]{opacity:1!important}.gatsby-image-wrapper [data-placeholder-image]{opacity:0!important}</style></noscript><script type="module">const e="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;e&&document.body.addEventListener("load",(function(e){const t=e.target;if(void 0===t.dataset.mainImage)return;if(void 0===t.dataset.gatsbyImageSsr)return;let a=null,n=t;for(;null===a&&n;)void 0!==n.parentNode.dataset.gatsbyImageWrapper&&(a=n.parentNode),n=n.parentNode;const o=a.querySelector("[data-placeholder-image]"),r=new Image;r.src=t.currentSrc,r.decode().catch((()=>{})).then((()=>{t.style.opacity=1,o&&(o.style.opacity=0,o.style.transition="opacity 500ms linear")}))}),!0);</script><style type="text/css">
+오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 , 와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"/><meta data-react-helmet="true" property="og:title" content="AI를 통해 변화하는 데이터플랫폼 근황"/><meta data-react-helmet="true" property="og:image" content="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&amp;q=50"/><meta data-react-helmet="true" property="og:description" content="생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
+오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 , 와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"/><meta data-react-helmet="true" name="twitter:card" content="summary_large_image"/><meta data-react-helmet="true" name="twitter:title" content="AI를 통해 변화하는 데이터플랫폼 근황"/><meta data-react-helmet="true" name="twitter:image" content="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&amp;q=50"/><meta data-react-helmet="true" name="twitter:description" content="생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
+오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 , 와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"/><meta name="theme-color" content="#ffffff"/><style data-href="/styles.29ad1d7b30b2be092df6.css" data-identity="gatsby-global-css">code[class*=language-],pre[class*=language-]{word-wrap:normal;background:none;color:#000;font-family:Consolas,Monaco,Andale Mono,Ubuntu Mono,monospace;font-size:1em;-webkit-hyphens:none;hyphens:none;line-height:1.5;-o-tab-size:4;tab-size:4;text-align:left;text-shadow:0 1px #fff;white-space:pre;word-break:normal;word-spacing:normal}code[class*=language-] ::selection,code[class*=language-]::selection,pre[class*=language-] ::selection,pre[class*=language-]::selection{background:#b3d4fc;text-shadow:none}@media print{code[class*=language-],pre[class*=language-]{text-shadow:none}}pre[class*=language-]{margin:.5em 0;overflow:auto;padding:1em}:not(pre)>code[class*=language-],pre[class*=language-]{background:#f5f2f0}:not(pre)>code[class*=language-]{border-radius:.3em;padding:.1em;white-space:normal}.token.cdata,.token.comment,.token.doctype,.token.prolog{color:#708090}.token.punctuation{color:#999}.token.namespace{opacity:.7}.token.boolean,.token.constant,.token.deleted,.token.number,.token.property,.token.symbol,.token.tag{color:#905}.token.attr-name,.token.builtin,.token.char,.token.inserted,.token.selector,.token.string{color:#690}.language-css .token.string,.style .token.string,.token.entity,.token.operator,.token.url{background:hsla(0,0%,100%,.5);color:#9a6e3a}.token.atrule,.token.attr-value,.token.keyword{color:#07a}.token.class-name,.token.function{color:#dd4a68}.token.important,.token.regex,.token.variable{color:#e90}.token.bold,.token.important{font-weight:700}.token.italic{font-style:italic}.token.entity{cursor:help}@font-face{font-family:KaTeX_AMS;font-style:normal;font-weight:400;src:url(/static/KaTeX_AMS-Regular-d4531cf7ff335a5e1d2c2caa803e2592.woff2) format("woff2"),url(/static/KaTeX_AMS-Regular-b1489df1556f8c6612594025ccdca2b0.woff) format("woff"),url(/static/KaTeX_AMS-Regular-f80d9eaff7bad6dad7396a98fc016ce2.ttf) format("truetype")}@font-face{font-family:KaTeX_Caligraphic;font-style:normal;font-weight:700;src:url(/static/KaTeX_Caligraphic-Bold-f046a374a80bb69ba397ad705f607490.woff2) format("woff2"),url(/static/KaTeX_Caligraphic-Bold-7ce7636b90003f983253ab36004ed376.woff) format("woff"),url(/static/KaTeX_Caligraphic-Bold-0c96bc8fe7861c576cfee97fd1af3b2d.ttf) format("truetype")}@font-face{font-family:KaTeX_Caligraphic;font-style:normal;font-weight:400;src:url(/static/KaTeX_Caligraphic-Regular-4519ba4c9ee4f9b689505e396b96d93c.woff2) format("woff2"),url(/static/KaTeX_Caligraphic-Regular-4a559f36cc9a9ff50a2a5d8f8c7e5d07.woff) format("woff"),url(/static/KaTeX_Caligraphic-Regular-35f3c951b5a1044753e0eb4183d55103.ttf) format("truetype")}@font-face{font-family:KaTeX_Fraktur;font-style:normal;font-weight:700;src:url(/static/KaTeX_Fraktur-Bold-5b8749ee09f3aa84381365edac89c624.woff2) format("woff2"),url(/static/KaTeX_Fraktur-Bold-2ea3916b4309d29ba6938ff96202f3a8.woff) format("woff"),url(/static/KaTeX_Fraktur-Bold-069514d4061bbc045836eaec100359b9.ttf) format("truetype")}@font-face{font-family:KaTeX_Fraktur;font-style:normal;font-weight:400;src:url(/static/KaTeX_Fraktur-Regular-2c629b06891ec24911f53781b38554fa.woff2) format("woff2"),url(/static/KaTeX_Fraktur-Regular-0d90113d64d307cfb9e44a81546e7608.woff) format("woff"),url(/static/KaTeX_Fraktur-Regular-96556db6d8effe29a581028d82c1ac04.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:normal;font-weight:700;src:url(/static/KaTeX_Main-Bold-20b90c2076172b223ae564a9bb22e0fc.woff2) format("woff2"),url(/static/KaTeX_Main-Bold-a9cdbc850d2f94b8887ccf38fc6d6d85.woff) format("woff"),url(/static/KaTeX_Main-Bold-07e762d041b580e5d32ae14a9cb27450.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:italic;font-weight:700;src:url(/static/KaTeX_Main-BoldItalic-b345de5bd14864bcefbff8f92de7a1c8.woff2) format("woff2"),url(/static/KaTeX_Main-BoldItalic-7649d52f66dfd41d2cee9aaaa0019ccd.woff) format("woff"),url(/static/KaTeX_Main-BoldItalic-bc8d96e9689171ea65cb379f7967fb4a.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:italic;font-weight:400;src:url(/static/KaTeX_Main-Italic-ab751a9e86a16f178b79f99db42d3ea2.woff2) format("woff2"),url(/static/KaTeX_Main-Italic-e3954fe9b7efb3f438d218f6e8a8e049.woff) format("woff"),url(/static/KaTeX_Main-Italic-44a32ae60521190623e30c98de29ef17.ttf) format("truetype")}@font-face{font-family:KaTeX_Main;font-style:normal;font-weight:400;src:url(/static/KaTeX_Main-Regular-13b3f8528a571d1cb797eb520002dde9.woff2) format("woff2"),url(/static/KaTeX_Main-Regular-9e75cd605a0f61540bc6894c330f1ef5.woff) format("woff"),url(/static/KaTeX_Main-Regular-af7fc7b32dbf2a640c9c26b2a0a7d050.ttf) format("truetype")}@font-face{font-family:KaTeX_Math;font-style:italic;font-weight:700;src:url(/static/KaTeX_Math-BoldItalic-d5d35e84b3ac1dbffd8fdc3dbea97849.woff2) format("woff2"),url(/static/KaTeX_Math-BoldItalic-94810ff68bb3c9cb6d3e9f3e73001b4e.woff) format("woff"),url(/static/KaTeX_Math-BoldItalic-4d6241be0cb599314b9ae4af29d68d38.ttf) format("truetype")}@font-face{font-family:KaTeX_Math;font-style:italic;font-weight:400;src:url(/static/KaTeX_Math-Italic-ffda88030bb30ae4a0f437dd9f86add2.woff2) format("woff2"),url(/static/KaTeX_Math-Italic-11278d3697e58b20e960ac9ee24ab338.woff) format("woff"),url(/static/KaTeX_Math-Italic-cae7ea2682cff6985955cd2cf261504e.ttf) format("truetype")}@font-face{font-family:"KaTeX_SansSerif";font-style:normal;font-weight:700;src:url(/static/KaTeX_SansSerif-Bold-5a20a4753af7a150824ce63096b7acc3.woff2) format("woff2"),url(/static/KaTeX_SansSerif-Bold-2946bdb590f9bd4c7ba30978a7eafa68.woff) format("woff"),url(/static/KaTeX_SansSerif-Bold-f0ad0abc489e2942f9e185a885d31e0a.ttf) format("truetype")}@font-face{font-family:"KaTeX_SansSerif";font-style:italic;font-weight:400;src:url(/static/KaTeX_SansSerif-Italic-e5fc2aef496040d3f44502045a9fa7f6.woff2) format("woff2"),url(/static/KaTeX_SansSerif-Italic-c834ba6da13819f078ec34f212d081e3.woff) format("woff"),url(/static/KaTeX_SansSerif-Italic-c7feacd514ed1bf5669a9a4ee68fe99b.ttf) format("truetype")}@font-face{font-family:"KaTeX_SansSerif";font-style:normal;font-weight:400;src:url(/static/KaTeX_SansSerif-Regular-5bf289005d5caccd361ab39e3a94f3b7.woff2) format("woff2"),url(/static/KaTeX_SansSerif-Regular-a4fd05630bcdec90cc1a744cc7462c35.woff) format("woff"),url(/static/KaTeX_SansSerif-Regular-5af9e1cfc966c7b16e7615fa66a29955.ttf) format("truetype")}@font-face{font-family:KaTeX_Script;font-style:normal;font-weight:400;src:url(/static/KaTeX_Script-Regular-a1c15978d325f10dcb49f0f8bd7055dd.woff2) format("woff2"),url(/static/KaTeX_Script-Regular-cd3b0634cbb3864a6105cbc61511f48c.woff) format("woff"),url(/static/KaTeX_Script-Regular-dd0db7aef0e4e809b61410ce74227665.ttf) format("truetype")}@font-face{font-family:KaTeX_Size1;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAABXYAA4AAAAAMqAAABWBAAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAhBoIDAmXFxEICrFYphYBNgIkA4FMC2gABCAFjWcHgxwMfxuCKyMRtoO0khFRObkZ/OXxxnDkpMkqiTL8upa1/onYf8by+VAum62LIrOdDjx/hMY+yf2DtvXv7S4LS5SCUQsYWAiIik2bd/adcQFGYtVlehk/Wy86vzPn/ciQIBu2uf1eVLelurcNVyXCYEF4HM7hUMRjVPUIB/D/aOtnRQme5oYHvjOIfdGsoZKgmbWipqjTVSeD9z/AOOz8vy8clvtXyKvCe50hNZHrTEhSl9PMoX8nsiOEqkkSnkz0cK9YpVse88r05j5y21TsUFRUiWPTw//pLNs/I+vteoK+IOqgC/ZMdao0zXhkKRqNzQeynLydJZZ9pAOyA/aGiDv7CL0bxqJD6LhPUUNRprx3RZWiK9OUKYt8DKvf9jMJdbeI524kpefVtnCbIM1SSIF7/LoTfxZAxDLcCBxAPBMnAGDk96HxAwyJgOf+FwH8IIVvv4M3UHzvrAcL9neS1KRZdaYUZ7EAG2aRvFOzEAC5E8FgCLAr8PTXS/kTQBoWJRArWoKZ5prveeIS8YQkWaVqk2qL6q7qvlqmDlRr1BFqnfq8RqC5E/VVDBFDxdA/TE4KsLQS1Kg4IKFKdotVn9HwtvgyBuC/P7PcE4+9bYP1vP/l/Gf8T/TBP08XP1301P7U9pQ7MTnxxO8TP024J4KfVL5vfRT7KOZRtDQR0FsT5kFSEOOgCECV3IjKXVC0nuvOLTJsdwqfwE7z70OwjQIcR0InJ6rDp7SoIU5ARRwn6ek/EN8+hX58iph2aNO8UqmIENr95wUD77nNnPdAFWC3UQ+IOTQgYJtVAwEtxJlXUP5Tr3XIPp6P33yO3rwrlaL4VfRYkhNmoM+cJlXq5m6BdmSA1If1tl4Azni0UlnT9YDPs2KzLDYfwMmQnMwJSQfa4xigWUu+3AYSGgtKu4Xg8KSPlABdRui8T2DTQMG8eS0q5xXEELGC/TiAe2+GTLzuUIUMb3Tdqr7bC8q/jvmV696kaMmVtbyNm+28MxxYXAMHcHmjByJGQFvcKE0AdHUQr1Xl730mOEkDF7K2hoDzf1TwEgCuJSfaTB5tl8VDzx0Dx+G6jzowC2YhyleWRTN9SVCaNS6apxYJS0NQUgdhd1jSNAWkWjfSdV4EclKEL2MotQch8+xt6gUj0hm9M5+u+wYRKtFyUt+NGsQAGwkhn+zCnR4JCRGISpGImnslENLYLFf/qOBdNE/EzCpucWoEqybF03exUp9Ruji7+dd+WDKl7XV8+vaScn5XfMaWo4Lk+N6SsELwGZBYtRZAaKjCKxL5waUJUl/ZWRSTUKNcWSP92cTbvAlFHRsQYarfvQkhp4hiWC2SszOTyVVWgBM2Aglk9ejw9mH7YK0izu8iEgkaI5AAXwB3UAafv6WLdTBzC8Vd5b0B9N9wF1KDLyr43GhQcIygxAT4YRL8MQUBmAOBmIYgzIVgzIMQzHijoRYsqxIDPyUW/k/oUKxRM1dRGApFLNuCChOgxiRoMAXhmAMRmIZIzIUozAMtZqy4CHvQQHx+RtpoaH0xzAvlaeLa7kejA/FGfNKQAGmqgrRYt2Xj2ZlndJxPZ0Kfp0XjkoSkcpxiHG8lTxOGBJWmazVC993mif5LSXdtLmhWlCa3gPIXvP14Rge2VY2OXm8wQXuauu0AdvgBNSShPbPXkMxDOXWE5/wpqESwvKS2uYCmwbselzVTIz2d4syNj8OR0Cc7qDh5vcEMQAmlp05bHYY3lkUn0l4x2w6QOl6tqhYoCcyucA97v+V1/EmcN7s61uM326cwFfbyqKIRcmySYUj2KTtPR5FRvwbBvDBIdovDIdiBSzI/i4oOqzMJytuk23IGjxMI/erGLjVrb9uGm4NnLuFoR4srd6F8YEKtCWrWJ7v5TFrpgbQsKFUncHwqHNvbGivpe4EnQdKEaWVFszPIuidGYpcF5bHVnnkHgV5FcGKfolWseLwIRzJWspGNAtlSz7FMR+LMkZ3n6aK+mjntyYKpTZ4zeRMVb2qrzpEb44bsA70awiJUmvXerQPMJt1rG5BqhVVY1VxaMe/yoNiim0nYGw17oxalaU8Q25IrHYPKOy7oUJPrxbQJmR9smrnrnm05X/YJPrlqO6NipgG7Jng70NkivqOcqKKXpnsYjtYJvdGUHJLcrrxBBeymSCrN+QNSvlCwNFCOTa0mRfNMV7pwUJcpCnp5UwY9PoCjoakYoYggoGKMUBICcKJSjFBGEFA5RqgIAVjRNIwwnSCgSoxQFQKwo2qMUEMQ0AyMMDME4EKzMMJsgoDcGMETArChWoxQRxBQPcbOhrjRtHjbjX9To1mb0oSyoTkNyg2yQEsiXQhaA+nQFkgX3i17QntDBnQEMqAzkAFdgQzobsiEnkAm9AYyoS+QOU1/3H6GIlZRS7HFjvIaRsnw4qGlZVXxgPBfDQAAiT+ocTEOwH0AYJ7gbT9SgBdAGAIP8xOAKL4RxImT8eAxROLozOzHk6V8lVJe2rakyE9LRb9CERMTEWkOCUCKa29NMmlYZIKODptWzgYKWAGf4bJikVSsiw6mNiMTcATUPYlwCcWqEWMLJMmCleHvO4GK+gJZFUin0HFfaopSphzGee17hxMLzDNiWGq9nMZggFph8KkcOCx9gcPGuql9/j3iVgji1osI0qOLyWs6RwoWRcID7+9gtPqU467PwyEqvoRYQQXjtR2uxjsxTlyCMQWSHMvamviOrOt7ThCaT9rdzgJJV+ejLPieJzgZlU9a3SmUIKcWEHVB2qQREiRHrGs7X/uYTqHirs/dAXs7OKHG2gEXY86KyXva65IdiVLEUWpZof9ChPpxn51+Qmz/pm2NYek/czxO6PG3bo+ynM4vj1ogdxGSId17x/g7o6FZC8Ku67CXL5dzWCzPVZrjUixnBad5SAErIhagElCfH3K/oIQD7rMNYEbDoZkucFsLTveiID1DWqwAqMQORIbsm0hkpMwpyOyccKqT7g8dPziFlzAIuY/dWQ7ItrHeFEmfX/1MbwbtaZqH324OMShD7LvwluVgGrgotiFC8DWAjp1qS13+Kq5UrjY1qPx/J+e4SiVcfXg1Rb2PFG/fiXaUNbD/U0sWSpxw/46PXRe8Lus491eWJ3q+dbGKIqYWJHlOX3KHk3ZgaVbNiEEsKpDpeQr1j+e4hNpfdqkZVIhsUdZWOG+Q4hDFdebJbiB7GkOItNTihO/scjD2xOoAL2lnn8Th44+B3KX3QNXHOc4V24H00FWZiP8KumYDD725Denha6BSdqB/D+X2DVvq0nr5b5J7NsZdWNq6YZvTwcd/sXbW2+r8Vq7+Be8TQvbKw9VAts2EMdsIMdm6Teva6lvRHIU0MehYBmQ+DrojTxW9GTBzhatAwk/6UDHNtV7ytThpZ2thaMvCkW6fRvXpz8iqOWovOe9b3/B+o5c5L4nIqg42Ikq2ZnqBKE+HqwSdUhM3u7HDU6RMRuUhabHBSkLjVXXIio+LXPjmrUyQqXMGQhcNptE8Wtt7hfHTmKsGtIRxsph1HdOji4gw2VE3CutjrtVaooxgkEZwfLG+n51MTp06rQbsGlG9rhoN7r5fiy21tZqsVolxYooZM6bXV3jn9EMXkCLL8K5IR0XhhSr2/lMlNKdIj9SzRlI3c3AvY7yP185XFx+n80Ce0xek2WHSWRgzksqMFLGgwhw/qW9KZZqHj/NwCS8H3PudmGcPveiT9PFjLb2oIUasm+Vzps49mijy8c5Spu6F0SMhdGd70mdwQfL4umoAbgDJHd5eegDAdHtlvgKEgCRmF9J7WAoh0sydvzq8M1z8auD2lTxMZR8hIZf6ye9GFICALvBbr7G3XVFnMI4ZeTv+vjhH3+UOriCp3e/tvsH3Lu+myIpghap10Pq/Lw8ndLtFol6u7+53zg8NU7nbl9cj60xrCvVxzRUwN/hEYPkic40IGA59dcZ7Z7Q7Z+/U0oyTf4MR1Zhvh+DeirhtMhrrYrRnaD8d9JNpFSJxvic486MueN4/Clr2gKs7323ZnyQUmQ5s+e6ODiFNeV4c5Q8vzP/E3R6iQILQ04S4QizvPl4Q/9aU5/dwpn9fUeC//7PqsJDAAs6e56e8VRB/vFtO05+UWDgckR74UH3B/5aXcqJHJu85wctO3eXzXR9l+l9FWnCFWIQa5/2JxErO7j2cgsCQ6rDP9teEZmv4SBlmhuo9peiRSWjlXprux8ULCcTogNwoHJmiUmwvWzzDBDbd+eRnLcYskSWJfsNuYdJtiTtPvk2Qr1wdtxozZOUrut9ItPCJ132c9lV52P3ajdWx1ftofbycqbmtBf3LE6xx+z3hhXnX/4z98/pOe0+7P866JJZOmQ1fvGgu14dBz3MtTDYXvfhs9cqvL8Syi7Y6VRbTDjh4KHbb8Z/iLM6co63Ht8V6d9iSHOzWRWzsha9XtpvT8I2XbZ5DcHCHxeRUnS6h6EXlv52DtSXRBnbPvgJSrM3Sip3k31GeLWPwHtIcG/m3cwNrU/eqVqFKK5WSdTcYHdtSu/ufKZ3xjeqN17Xtu9v3Knz1Ve5pn9Q20Hclq1BtP4GVSW3v4sOJD1vIjzrDzFXPndF+bX5j/DV4XVXCJTV4eLzGW+PFo/8f+Z8vpek/seG7xu8g7EcV0CqUqmilK3Voj922Fhqbo95/vf/gPyEM7ipIozfVZbFT0Y06uUzHZ1SxdJo9y55Gx6qY+4QJZn9UMvl7yyvdFHPCN3Qu9GxU+IbhHz+fK/MPSsS3RCcliwOumfw35Og2PCQ+5Hz8RKc8LvDf21TP+UKgjEs8IaxnlouOS5b4vLVF6PLe5O4NzZ04EKSkVU8YCNoHJ4ZTJlDK32/cssfwH78NHs9etvl7Xc+Vn4Df+X/F57VW4wWwTZW5g2rVYEBpKWv9hNQzFJM/nzI3eSyzkdtANCs4gko9fQh/Wumpr7eY/xj+akJEYON4RqFJl2C30WQQZb8UGBvnmuylyUBOjmQknEP/PtOUx3f/6dMsowk/X3Kr/OUA5VmfF24UfV70WQAlG5Qrz8o1Dc0JIxtldZppZ+nk8/ImufKeRrYlMuOdVkPK89HD/8jPKuWDMipgkS7T/GnyuaMQv1afenzrW+HNpT9o+zCAXvP+D0FhI4oMC1ew5NA7C4QWBphqV/w1T4Azp6KSGeJaMhQjYaHvefGdtmBRyXB5+aD96drCer4lGGx55ye7pCFvhtvBOhBXLhyeKZT5DJaXD4tKg8Uyt4INLIdmhisq8/Nr/YbrW+r8OuEnOEzb8TNZ6x/a2ytnrJY/3tOuRCjLv62lPzWt1FqWS5urY6tpv7JSHxl3QejCMEJTNa5MJqpRLlYvCOFt9Pyayjaaum+R+Yzmk65SI5Jxvjl077VK9VRJV7yyz+f0elNLxFTBTH5Uvaoswr1pkztiutpdW67mcvOmCHeS9bWqikilP8QPvfn6o092yxbFKvtWKE9flG1kHIx0VVXtjOYRv9+iU471h7w56jt39jda9q3Q8Csa9RuON/jm6v7u0jEkpU1MlWWrV3GQ6vN27uNZ+vqoOO4Wb0mqcH9MVdFQbnX2hqJS5no7tT/BLVukV25JTKYdQr989dKp6eNLli7FsKRnvMr20fY/DPGNOCqFfYyD+dDk3fHrGlR/L3MssJeiXsEs0T2WkyPBY+8RGvSGD+1cieOSevjQX7wa+OFQalZea1+FfMnmvKzU4bK5Qf7V2ywpqWlEfK1UXBtPpKWmWLZV8/Qbx990bBqsVzyviN+2Sxr6juLIkRi8GMVImKpdcZeG+rdK3q6NhkWwGU7K30sEnyw9SFMIxCZ2v5TER5ERBgkC4ROERCVB0RIRMaRCFk04yIElAiRCVGQkGEkoJaReVDsKcwUXZHs2kIvp7FBhcnk9B8I9fP3NGJGFS+f1Nrv1JFYMJIAgYixXoz93UqTPNtH5DtsyjOE+SApVLEJrdnJSgi5a1cec0WWF9kxj78GCFDVuLEFs0+yb8JQS8LyKProezpZk/MYTkF8CALy/bxfjrfa/G/+/yPEnSwGAhwAzqUxVCdXZ9a7GyYHinILdE/0NuyBewt/N+A476ZyasEFKegGu9XuUkQMtLhsricXkn3EcQPDfjX0+JPmIxB7o2iHDh9RRo5BSM8uCOfMldKYpsGk1uwnf11GitT7pokqry1T8Wowr+9vFHjRzTxw9JTsdzKfNc+MA3CDUC9zYqHvACQKxGKlBAGxlB1RNyiSmAkoMkYYESjQC1wyNpFGnUXys0DhEdpXTak2UEuFVTSwwjZdLzSgyi4RgljnjRfzF15AytmkEcbylkVxxVKNExqTGEZiJKKd9TRSNZLYmZsq9Ui71sWy+f/OQrou+tt2Ot2+N8KMNO6XIN1gVnUQMpqnMbEGzp+NOtwUFnvKGytn3C4oZnk3G7opE6dfsaWpgjTo9m8aOjMWHpWSG7fJ90ev0OhPac48LXVabwe9ibDK31TPElrv8WdFrMBbgbaOoJ4gsko7j8yDNm5nYypjd+Pz4czo+nzWma5lfY2jyXudjhLlleYXPRtAnGe9FZq49adARfVETIsG+Q7Hl2aa2lrCevjS+favxwx/0FV5LtetY5Coc8Q6BXacuw3q0aNKsD0urTjSWkZ5eqngBN8DkLIcGvXN4h5gtU5dQA69jvXFYee710+Eb2MbAhMy8wCs84Mia9aiH7nbDCiRUvvdKs5VpMafboFRDWlU/L48eLp069PV5jy4aTAkd8uuShoUaIj4+O0bzaaLooULpzOnp2hekidILKi5mcLkMg61unXaelG3WyvmQHNn6PyRLNPnFDMfaRld4ogUR8DjIDWrBJ1jiRC9dfIA11WMPalzWVB7tZ+pw2CXE+TpvVip7AXiZgBr54IV6YuxI7uWijj7UC/VB/aIeh2CRiQaQbJ7C5BbpmrOggcpCIIgrfthgYG0DYUnz3SyPgShaLpdQLW85S43wGM5ZlYh6+6ThHxPNvCvxBJLrVXd8VOZ9WehQJLxkP/ETFHEpnJshNE51simjeCIj+zNCQEguSzaLWdyJgPdhHEmkkIM0cpGHDOxGPuyCV1CAQtiLIhSjBKUoQzn6oC8qUIl+6I8BGIhBGIwhGIphyKIK1dz+jha93qrvP32i3sj0tXjrG94flSkYZ3pWrqenp3Owv4tx2YciROJkrXcYF+ZMrc883WjQ9zcxJqpJql11BJyb2PWqQTUqiVsl6s1qqmoN2DZy6LdKcZqV1K2ser1qUI2qCSfv5HS5HKpzdS4oeIUrpZVjiOurRpHvMPvjGNCHMYAY98C8ux0FACauToLjJRxXlVSOWlZVilCPIz3HeIsAsyO3rrxSl9+h2mMgnB3ByUatGyOWXU69AwAA) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABooAA4AAAAAMnQAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAAPSAAAAE4AAABgQ2JZAWNtYXAAAA+YAAAA7QAAAhobTaO1Y3Z0IAAAFnwAAAAKAAAADAAAAABmcGdtAAAQiAAABYwAAAuX1RTb8Gdhc3AAABogAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAAyXAAAYrO5FPkxoZWFkAAAOZAAAADYAAAA2E2h062hoZWEAAA8oAAAAHwAAACQGkwLaaG10eAAADpwAAACMAAAAzHYWCaVsb2NhAAAN/AAAAGgAAABoij+Qfm1heHAAAA3cAAAAIAAAACAA0Ax7bmFtZQAAFogAAALBAAAG50jJ4LVwb3N0AAAZTAAAANMAAAGcu8W4hHByZXAAABYUAAAAaAAAAH/i0Eg6eNrtWAV420q21jkzGskiW7IlOYljx3ZiO3HQWAxs4ZZxy11Ibm4vM0O/9rvpMjNT+xiWmZmZmZmZo74Z2c7zMvN6PkU0+c//n3PmjGYklCqSJL0RXYlIiqQ+j1GQcLJctat2sWrnK49erFTQXf5KBZ4lgfTY4Bz8G9knxSX2nBiByXKz5jSrnptQmB3zxTlfwMfefm2Kac98psZS197+k9fB1DwjVH99cO/gfm/UKWHzMCVxrDzHmuJYLseyBdZQApV8rlBvNBt2rFgo1hrVqufA1G3XmaaK2tOfrqFqmhzyDcE756ki66+FW+DW1+qySuaDd3DEZnAONY4Y5YgR4IjQqFY8l0kKC3El+JSqR0wIjlFm8jP8K9lsmBr5yemIONHTHOPNnNX9OYbCMUDiGHG76ub58eZXPparp88o/eRppZ+zpaGwleBGigWpWOBGfU9CjZtgNDgGwC8UCv8avFgzjQg9TdSoEfnJaeEDLzgnvb9tjYCwVudO54f3ylc+loyUfrK3RO/B+13KWX2M99vD+02EyhRhjLdirc5P/OCtUK81mqLVxFGv1cMb7sVKo1Kt+iJKTGHixJvie6K5Cd8TJ/gYM62hhcGoCkAhPp3RDEoNLTMd57egRotXOYBIGVpMHd2hy8AyhR1G9FjOkUHWd4yqwX8yvX/cyT4tWbxMA5jIWpQyw5RlamU5Zf0As4rJs+nEVJoBsxw0xlPWU5/ASplCD2UD430p9oSnWqlxA50uvbu43lLol2ZFeJU3P+EKvoJ0S5CQk3ATrsJE43EW6sPWvmqGjuLP+d9xzPOLq2RZNlfEGttGVXV0m9ESOrgwmGJA3Ol0ggHITu5Y1Dg+KFQm7k4VBgrZC1yonT3bEppZZRLbIeaqTEfk07LOeL/OLBMpS6QTPezxT2CpvvEBRjOTLZmVDCBBOyrB+R9iEWv4RcnjSs0wj3I0L8hWmw1O3aM+11gsDILPgh9BRIW4szX7IAIeizAKcnAen3STE0PQtJKzCx9DHVMGcp3ILcADOILvlooc2Q19GCamaNVKsyncx7MgTFrR8jlFEXa50blpUx6cWjskR9Zu0Ay9z7Tuss72ekprB2Wt9cTCp1SB+b0UahGuk3iaVpUVp+ueM1h+KxYl9bfQFnzld9S2/D48cD7o1ga/pbZA/6OIQwBJwggebVdNuVU1s3Y1bADlZ5fx6PK/iUPE4hreu4yHpQTnq4d8myKVXTGA7bwthiMfrLBFVnbcWzYWdpplc+eCIS/h7oh+0ySO0qFtRqDCD41tQ3QUR38O0RCIQ9yuSHZXgAncOrcAq9pAezrI94QfBmob5o4VcMFxNUd8Fx6ShkU9bnEUDhU0C2GlUXgd5GcmDLRIMyZoc+InVUr3PGU4Y5JhbfOcBmVjYEyWU0WjrG3YpA0TMzP8FLwgpkTOHUvqchlsOVdXn/98eJSRm2PqSNkILocr1EZWtqEs68ljLT7A+RwO+aQ6CjmdcEjzguwLyw2hVxASDIVoTzCGLgKgzW1uM9jTxXLThq/CFcHlHfvwqOc/X63nOvbPdVPNNkS9P8/ILfh1aZCzSVPORvb8qputVwWZrB3vuuM88vWsm+feIY6xwwpebW2OkeBKWLkmsc0WmbNKw8oTqrRUomUxg+0O9nRuykqZX2FPn9RleUjMuaHlX2GL0/h50z99RcccTAtzAI/o3AjbP2+Oc9hNFlaMg7SK2/4Ct91cqcONbNZPo8+HcejxbM71JN9TIFGttMtulRuXB8RwC0d5bQJr6wn8J/zHsOZrmEh48zPNE+ngW/clsBEYDR75vo9FL5u5ZrVmlqKrreBwcJgwAi88fvzFLwL8Kl7VN93PYM2hRFxBIMEGjLBgLwB1Bo7GsuX/GgFEhVD88JVXwvnzekx47OrgLPkpnz1SIpMVkTkVnhZSU9QIFxgyXhmKvCqE5yYocOJigAAVg0fpS2ueuAGUmMHhYk4Wenf86OtfB5rVdIctv+jW4KUP5N2Xf2pYvb1ruaWHnf+W9FK8XkpyS0rLP7wMxcLKU1+HhXW0UavVH04HZADi2AQAF6NRXH4qRqNaJFturtkwvWFNs5yNSBIKNHh8iDbFa8pArwL4KxCbv8nMx1vXtvNrTGq/ion4unk7LpAhaRPXNZPmurxKe7ZVEq0a2+hqlUbVExU3txJzUXJF704TRPnL/SOpJKiU6DTmx82kYUetWC/t2dKTxqg8MZ0KXxMatb3RhGFqViyhmX7/VG96S9p4eH8ibQABBA2NiFWYfMfL73yL+9CJGAOyftxLtV4jyKpR67/o3i9d+p/aBWPTSXPa7fMkFIrIy0JFD+C+vdfiTBr/WKoG/+K+gZvbb3Vqe471K/6ZkmjM/+M6NvWHBEUiIipysh2Vd0naC97yXyIy5I8YmX/GF27+C4261F8qschK/Toh3Szdh+fV0h3XX3LPyV+VV832ZBauF6axyY9fG1v+z62lE7+0UFEs+v9hjtdEjzxjLjdQFyg1/lnihongVjjKz+dBLEpkasIGX1V798tRmwJoKvzy6MQ11e/qiDozolo7Ut8DAIKj6yeHAOU3jA2ogCxGWKxQ//kYjr12GIkMua3JXDa5P4uUgiZvn5Z/uXdHH3YCI7xvNtfpax3Kz5QTbWdjHQCMnbXxjXFGUxv7yhfEKKN9Wx7kyoq1rfX9opAIfl1Ki1W5WFH7LX+25mPP8YUnW5/qSCSFzcd9QJhFvccz8eyePZh0+MXgpQ8KvszMH/XYjKjkkcR1aFD9wuc1aicdcgIm4WE//ZjidNsT30s9KObkWmgIGo6IazXMAIVhZ3lAxrFYaPqOZxHoWX/5qpEYmp6TxD17zqLlWrpCjUcN7R8GxNc6yTj96YefDpWn3TZKnKRNtc9/IahSW5W1FPzPpd+8EbVuBuOcgQVCcWjKjvHwcwKCTXuxYrfm8BrW28sUkZnkAdG+TATBeMEpOQIRQx0bW9h8UAOMZNI6orXqwM0bplfv1BE+NNDPYB3MqktPNwFA791y5FY1eGXwWtY/cAU8/XJz35oDmdRFc2bwsm5eY5xXbmVF6Ntx3+sMhmbNqYuHITPRQhe1uG/WYv06AYyevrsTv/nAKgvRTAmi2sHtF5YWi4vbBUmCn9X65OBlwcvNI7eZeGDNflNQyfSz4LXBK5XbjmxPalpy+5HbFJiFdcxq77m8iuyT5J/dc3nzD97R2nC5tbVTAmbYp3unxPZ+UAq3Seh9fgWO2LkphTg/ubX0S3FsjlP/XOkHwVvoffh+iwSwSpLgQrG26+CIdR1fSnVWc/PB2XCPKNHJaKj4CULijhvGGbHmOM0G3BjHU6dPn0LbZHjnqVN3okL2OUrwqeCTvH1KcQwF8pBWIQ15xRC4OznuTW1cox0fHhjHSSC28iQeJ7gT44bcAmSmHZogsw7oSvCx4NNq8OngY4rhKJCBAd4ykkTEVzxN87hn+JpqI6+Gd1lXGYwD4bzbqeh1ylm7jLVrYQNqK1nJEivLa5HEQ2JMtWoj3HBkV1Qdy934ynrBgFzh4fOH77lwYP4RhVyu8Ah8wQeeECl7pfu80gGwj97tQQPDzdGb/ttlQaKcHhwrbyzjW/KgJB5y2e6768XFu84/vJDPc4i7Li4cnH94cOA/PuuA7L/+YdpG7X4XXppkevpZdwwMD4wO53MjI5Ikd2kbkWrSeq4vOmvMzTTqE+PD2TjIv1mkH1Zs3pRsvJAv2tmwKNhZ0d3zoZm1eadfK/LrQPCSo4/yAG640lBluAG8R+57S/BAsLbWHrof3grBA+VHvunXCX3Di0Gbu/L5MlxDROfnX7nmp++HG+Rbj83u0eAqmUPZ7/hZtWPSGmmbdFio3b9jw/rKb6tWbs9gYh1dLECjWSgq7ehCscbCN2Lyq/GXxfYuYVgYfq0HYJMI8kW7raUzZ5aso0H6zNLSmcgmE8DchI+N5GdynXsr+O6ZdVt4n+sTk4nrj1q/zismyPY6TUBpG5YvFdDmkRt5Jtx4BL6ngwDtPLkheNrS2i1ntI0morlRk7Cr1h3k3/vbmznA37XexWvNamsLsSp86VZbDs3nxV/uVOHSuvDtb1kYz2VukRWVOT2afCtLetpsE4gfs3wCzVnN+x3LZtDotVdPa7rMSFybXk2NvqTOVq8hVjxukTWrmd5V7/vErpOYCWWmZDnrWKhJiLazdqx9SSK6u3x1UkEkmhYTE80IRjJZBT/UJ6suI09lFtPSLNgSbIEXwgtZP7+eEKtW/oNRafFnd8Km6lW3yo/F1u+37weS+C3ytlJ9RR/x7v8AozlAwgAAAQAAADMA0gAFAAAAAAACAAAAEAB3AAAAIAuXAAAAAAAAABYAFgAWABYAPABlAIcAmwC+ANIBSgG/Ab8B7AItAloCmwKyAtsDBANMA5MD0AQOBGkEngTFBQoFcwY+B2oIMAhoCKkI9QlBCVMJZQl3CYkJmQnFCfEKXwrWC2sL7QwgDDQMSAxWAAEAAAABAAC6weBlXw889QALA+gAAAAA2LKZCQAAAADYspkJ/cz+ogUYA1IAAAAIAAIAAAAAAAB42lXKIQjCQBSH8e+9La2zLFgvadgZtZgumwWLSXvPwpqwZC/2ng6rYE/2JAdD3w0nGH78Hx+PxAxAApBAImcz1RWNXIjfrXXNPiOBuvdLHQL9Dfp7UYloxzErKhaDK01WTvDFk4MEWnW08rA+t36iGe7ln9yiqcfVTrzt1oRygx/9/h1k7OADRvspE3jaY2BkYGAO+reIIYql7++Z/2WsEkARVGAMAJ6LBnIAeNpjYGJqYZzAwMrAwNTFtIeBgaEHQjM+YDBkZGJAAg0MDO8FGN68hfED0lxTGBwYFN7/Z1b4b8EQxRzEGKfAwNAfxwzXosDACAASxQ/yAAB42mNgYGCGYhkGRgYgYBQB8hjBfBaGH0DaikEByJICkpoM+gyxDNUMtQwLmI4x3WFmVhBTnKg4WfGi4mUlQSUpJWUlVSU9pcPK3MoX1F9qMWmxaLG9////PwMDUK8GUG80kl4mJL38UL3aSgeUOYB6X2gxgPX+BWp+/P/O/+v/1/zv/9/3P+ev+1+jv7z3f99rvNdwz/me0z32u//vfr/77e7Huwl3Ze5E3HC8pn1N65qmgDHQBxQARjYghrGZgAQTugJQkEEACyuYYiPBeHYOTrzyXAzcZDtdQoxBBsaWhFA8JGjn5YOxANbHSYoAAAB42qxV5ZrjyA4th5phGHxBnpr07ZuUPcxsx8nwNH6fa9Fu+r28+wx+GjnL//bR9shJc/dyQ1SlUklHR1KFlSFWq0lsiV79pKYXX3Fj+b2Eb7o8b9MtylcTrjSzn0fVqFpf12uu57GyrCLd6StHRWnos2OY0i2fK4Y2iH9Z4Nrce/15ZzyK1+Ol9xNPe26eEC8sJB4/tS7xXVndtZaKgVG2wfNQDXfEV+X8KizhLCGAyDPi8YUkhYbkbFxWt2V1O3VTa63LTttazWoh2bTW56oh+Kk1MwCqRwsJ13XIDR0CvmUn9blmNHDRRlFfC0lOBsHlk1Uar3O15UEfUU45fBdX602ktZikC262ZBNtcfp0OcGRi6S2I/tcNzwStfuqMqCmga0ONbHSYcaVtS121hGf6y2fRwwJyIlo/aeaWiPxwE9TKyZppwQ5avojEyqKw5a3Q/aY2U/+eOkFODT0yDilONcZbQyZUq6wyeQC5DZKrjZ11hmEmDjmOl/GLYVbR12aNGVC/Ynxapx4rvZsy/N5yhSVSswbWcfnaQNDIp6MXsp1LHRoeUp2S9hNYefzDNzMlpQQGFhHXJ6OUspT4mmQ5vOsebWSFLWNjr3MU5v6G59PmFeLyavlgdL1oD9V6k+aQs1Eq0kxMxOxk4U805YmReuGxaR8TOGDnbOakMdCUgh5yDbMcyrDtjyNa9trd3COK/gvNRaZ9IC/B+3+Uh1TwEKpUxpsRawe9x3HKWt1yqhCVeKVhGd0SDFP6JDHwW8aUorw38/OOmpahWGeFicbbf6y7V4CTaeR26m2z2dM4Yg8C55FnjNFVeR5U9REXjBFXeRFUzREuqYYEfkvU4yK/LcpxkT+31DAzoc+t8rFpz63y8VnPv/HKJ5q/wWM/wXG/8A3AaNIDxhFXgJGkRoYRV4GRpFNYBQ5B4wi/weMIueBUaQx9LBsNd8g7GxKkcY2knJAspF+Cwz7bfYxSVcMUY+OqYTO7mp5xn7TAq3k89Wd8jhn+UqrqDtn4uSqLRO8VjJz7PF1Q7dKvDdg58SHg2DCEPxovTr7nZKfzmN9t7junEFGN5E/9Y7ByyrK7vp8ywTnHvp8+/dM2YnWYX4HJVFnmxRQj5WWzn6R5z3d0xkla8ifHUz0bcc5cxrx7xqgwoDgrzThsai9mQea6GEOX/d2jykY+OCaDsWKOJV5f7qYfFuhKrnfVuaqF20ob+BoRLkurXUX04dqHkBLYGPw2FeidENzNco2FhJsMhfrVN6gg3cyTQg9p7uooUaELvKCKKOkdFQQLVE0TlJIrqOh6oe8wqNk1CxB4HNh8MrtxkLJ7wsHBE19bsiBfghqHogaueoQZ13dk2BSrYeiLxMYMqpWkoAeas+FZlsJZ7uUN5rYvdj77Tso1FEdPKyMljZ+NEQQbZcmla/ngylul/Kx0RQIa108zA9tUATOaQzgkx31wl710/3WR9o8M3y3faTT0PC9do7A0ixAe9gGZQk4gGm002Fgd6cFNVo90HeH7jp4NPCG/4VW7P1T3Sfws7uApfGE7Km3Z4cYYyFjO/+u5O/pIQH67v6Ue0j5zGA4+0rm8FTANzGLz4/RvzCFck6f4ltYvzR8B+KVsBaDV+rmQPFrj/WAHEEABFA0xj1STOcCsb22OWv7WIMLbv9R8XXVH9Pf7L9wO5p/yojY+p5RRBWHICb24QGIKw5BguZDkaQBKRqQpgEZmhdFlgbkaECeBhRo3hRFGlCiAWUaUKH5VFRpQI0G1GlAg+ZV0aQBLRrQpgGGmLfhae4wmI+qrqsnVY8zw/CsQ1/Mu7AeMLj1ELn1CLnpWMz7MJ0wuOkUuekMuelczIcwXTC46RK56Qq56Vqcy5Oj4Ofp9dq8MMzjq/gu+Kbc7AERbE1geNpj8N7BcCIoYiMjY1/kBsadHAwcDMkFGxnYnDYyMGhBaA4UeicDAwMnMouZwWWjCmNHYMQGh46IjcwpLhvVQLxdHA0MjCwOHckhESAlkUCwkYFHawfj/9YNLL0bmYC6WFNcAJhIJBt42mNAAgAADAABAAB42kzMtYFCYRAE4PntDncPsQYgxiF/ORFWChWgIW4VUAp1kOODbPStDYCI8EDgVRZACzhh0RL/aNIKKbRpjSD6tIEbU/rvZ+4WOaxpDxLiRPt+8v3PfAWh7QDm4kwLROSQlvDIA63QkEdaIyuvtEFCZei/n7lb9lSR9iBvVrTvJ9//yK/eWqOi1tSZIHqe8yvmsUJcE/GhlVKQrwiiVFpL6VvZrlOzbYwhu5q2v/6brl4xpXK9l8uy2cPJmXNmZ1flR2UXmacz06Jukly0u0ma0DU7uyhoZiwXhmMaFUZF38Vp70t8TuNMFzQwes7Lj7G+58enmf3k9I4X61xXw1Xhh6tqwdRVCfXpQNHeSX6gHrhydlVQohLVO9Jl/GObdHZZ17Vaap+96nclyVetk1rfFb4JpbfMtjiOauszumPH1Ybn9HUhutFLPryKiqL7zLrtz9nqxde6YhIit4YLJ2XrYs4V+YxpNprQtORiK55sBTH9unKqxE3M9rWkN9rm+jlnCp1oGg5uSft+lHlf9jsdZypbeqeczb9a7kyHk+N/8B9WKPGBChYLZPAgnMGgJWcXiawLtANKZROuwXBBW4AwgxHMgo18Y2FGAStEv3VO0ds7nws3Fo0OrgMYQXMwllI/Fnwv+BFPkmfxKTjFHVhc18ihJWEoWQV8OCvhOWSo0HEfdMSj3XQ5UfUAlq+DDZkkGSrs3h/OMj59msHnEnVYCktoePF/lfMdanfnK7T+4dSbiW87lT7UNJJjRKK0oS8KE3NhThuw6Gn/QoQbaKnmo6+ixCkSPhPGNSpngl4E1eEdxGGnyOU0YW5ul7YWPA/5FDriUD3CRM4pyqA9dJ40HGLQ91cOfcludNbMJWhsZFvhNZ7lK9zBTHRIHOA2YI8+IuG9rFJwR5aDCe9WwgtWIT3fT7mDqdRP/qbmf7W5WNkAAAB42mzBQQEBUQAA0Zm/AAAAgAicoQh0UQJcdaIMcN73CPy9j8yJswAkEJGnQI0VazbsOBh48DQyYdKUaTNmuZjjzN28BW4WLVm2YtWadRs2bdm2Y9eefQcOHTl24tTZp2a5NmAgimEA2oWHMQS74znCzDj+JyvVM0jtz/VAlFNSSbrvw3m9Wd0uy3gR4nF78Xzefp97N7m+/a49m5bnz33wH+M9NYTJFIUjWMIK1mZJkKFA6ytN4QzmsDArSk7qKbRcTgQZChzCcbRumgrWsPFEcFtwAAABAAH//wAP) format("woff"),url(/static/KaTeX_Size1-Regular-bbd9552cef932199b58e31fb907f8b18.ttf) format("truetype")}@font-face{font-family:KaTeX_Size2;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAABUQAA4AAAAAL6gAABS4AAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAg1oIDAmXFxEICq0opA0BNgIkA4EsC1gABCAFjWcHgkIMfxu/KRXsmC94HKBlnAHx/5cDeohagu27Bd+UDRYS4HoJ9Iy0jqKYlRsb40/dVFO9V45+vBidwLEdz2Gm4PgTf4CQaHIvyLYhf9sMFn8t9SMkmfXh+VP/3PsQonVe0CZ1UKRTzaTg5nYAOkkZ9CXO7N/PKXA2NaGeLIYKjGq9HwCyagD/j7Z+VpTgaW544DuD2BfNGioJmlkraoo6XXUyeP/DrhS2ytZ278UMmJp9mQ5irIsgMT+tHJIQUHAu1XIo8YgobOwDQa2sAmBY7l+hdXhviuy9mdpJkvAtnfmt9poLbE7WnYBUTQhM5XCtJCBW5f8/16e992XyIVtKkVNw7IE8KiBj3rxMcvLeG0pKmczCzAdKRWYRZv4CkC+QAs7f5QKxYrX1iBpIoxH/rKqskbpaVdcQO5xIu+77agxhGzkvromsLBKeLtS2DwGUySArwQF0MX0ZwNLktZPf4SIU4cizgJtqXLuOZ1I5KG8AMiHc7GbU7UUjV8m0CsCKVgZhZwEEGWYtwwt04GtJ9jqLC891LASwkEJADJLQgqmYjp30Xfozw1g0llBLouUtq8x+OZbGsrH8ze4JKAhwyI/apFOL6vBxltetYvv/sYDnv2V1/+Vn3zlqheWGPS947n6u+JX+8uSXK780/GL4Pv1b67eWb83qOBDAAMKDxjTUtCgAURmP5baASRROt0gswVkihQyGTgMDND1OI8hxcgol3qWMHEHgKY6T9PQfuvUp/MOnSPIKx1teqfgiVLv/Ylcnm9vMeQ/eAG3Uw8McGggQ4lUDhRbi9RIbPvUOL80Zz8dvPkdv3pV6UfkqejKTE97MJd63pIpX7hY4WKuASohTOJHh9YhWKou7E0h5JoVQLaQZkgqp+ZxmyUHs9Q3QzhK+4A0MNBasdgvB8VWEkwAvwXmfIHEDC/PmtahcGlSZks8SPojvMszJpx4HVYT/k+tWnZUo2PA65leue5OiJUEh8228hGuXJZz20Tkg4o0ekXWAd0StZALR0UHTlfPsHgnu1CCC9OxBxvk/1qUCEWTmhHV+Hq3WJ0YvaoHjcN3bGyQT2j8tZXT3xAwQVrPGxZpoYSwPK4PmEVAu00R0tKh1IykzIuPgYitE1NyAnLXpBeplTSYvemc+XfcNClQa5TGgGzUoAYkl5HyyTuIuCQlFAd6jgupCFYTaKhvUP9ZlxZqgZFZpF6QasDg1nr6Llc1H6WLVNoX9cDRky+v49O3Rdf5WdAfVoqLn3jsqcMeQJKCyBAjVUOUbVAwPmZpg9JWS2S8PyxbLYkkunLxV2tm0QwGa3MxLNCHnFIUlE1W81R0f3mmFO2EjCMFlTzw5v9Y6rNWi8C6ikqAxMglIBcRBGZL8VvfX0eU2lPaqrcYx/oa7kBr0qBjdaDBAQsBIKAQRBoIJCyGEg1DCQxgRQTgRQwSRRGOgFvLlSiz8KnHwd52OxBrH1EQTblFgKzATChbCgJWwYCMcRBEeookI7EQMDiJx4g32IIaEyow61tAYOfQIhR7xXe5TkwgSjIRTQxKkqZzRZN2WjWTdR/KdT0/O6aHVkylJp8p5wzjeSm3MuYxTG6PZDd1XmXuk83EnJ4CY/NpVTZj+Qvj0jA5sq7q94XpDMrSnqco+YLyHGlLQntlrSMUuQzivuIM0VOqml9RqCqRzdzwui6e2PK5OceZ8gkjoUz0xnLze4AWYwqqbWPFIeGNZEkXaK17FUdIvUMumCVYCYiDaF/k7zHwdf9KzTcH9pGEzNIVhMBRTxUrg2yTHNLk0iTwUpcb7GMq8MBh2i0ie3c51kYehqmT3qzMJNtik23KGmBOoIlPQfLM2woBbkmdYhtNuq4oXwIZGSdWjUbM50I0nzkkv9GjAlPqFXDCDb3tbGaXnIRBLkDRh8pjDRK8qsw2WUdeHx9hqz7yDli8hOKu7vBJTPf4AnPJVzU5sOUdITxa978zg9oX+linEq63tTb8PTMoM50/eRDKa2pro9Tcy9RlHezWNTILaaFecNcBrfKPZA9KtCCTrL/Mr3nUFLFsS1bmcTobB7oUl054is8WxlDuoYtGsDr2xV0w7IGsBG2IuvWdbzrv8Qp/UFHn2sE1A8i/0tqVVVVqNBenJ8un1WBSdE6mG5NNxKewoGlT4s0tKLxcPSENQsi5Mx6ZWk2JNTOWVDnqkS8mpomzQQyA/MBGQNYWFgKpTwEZApynsCRh0MjgSMGkKZwIWnRyuBGyawp2AQ6eIJwGXpvAm4NHJ4kvApyn8iXZwHj91Swsh7/60D4qIHZC8OyNgF+RcgwCURAPURENqK3YDvb4JRqIJZqIJVqIJdn0LnEQL3EQLvERrKB//70/086d19LM/b3yqGFvlpA8rfgLIcrBuUAEyLoH+NfQA+A8BSQvCkAJAtKAF0yIPJw0QnYI5NqIz4ARFY4lYlo0wKcUqcWVJkLOF0Y5e4RmbQ1Ub1OHhSS7eDwuOVN1BpFytVEZq1Rq9KzmNhU1xW4MH4gEZ7o9GSIJCyAJU4meBLZBk0S2+ywPpj6ktVIVxXac1kPyQIO1gxWNvhCr7KVtyk8vnQHWWV3g2kKeIyQsMUAeDERJp5s4wV+GS2tMF3EEQFyNIZoSQTZiSZWwCfk2cUxWPorqYCwUjr2AUG1+uMKZgyKobfEISCTwxwCf7CKF1KqndXJA+XfPvtRaoVyrp/gcDxlNef2Xzi8lqnFUyQF4EgnUvGK2plM7Hww/Gq6uf+cz48MaHOQvZgvaEKVlgM8JLbv5tMKyM8f4/qZyErtsfnst0sstfc42e8jEu69X31vdaXIqDD1cV55bSB7xH+rk5L4X7HNLJvgeMIcQx9nB8OY7hdEKOrOzUGIMGLLg0H9oYkBeMOGHBdWsQgheiykSc+oIq0ly6b0CzaJMpqnPPTcfXkylixx/b8lDI9rzVoJepJcMlHnt/FFEsvB2bJPnke+ag4o9vjeJ/pkLI3mOqKFvy1B0GIdcOw8bdcIu76eadj7+W/3z2Z1OVy2csnY8tPymi+P31ODd880Zc1lfKRUgvgOp55lxUIE1mJb67v/SBD8ontiEdLlNLcTmfw2b7UwV6yZv6B73hqYU3vzK6f/lPAqzYzucrXkFX/eSinF/m3b3ke248pi96MTFGjvQD6/wV42SrTq8t+cT4tsomJeO8J7i8PkZRdeQ8pNtuzCkyjr/Pq7NCmh6pZU9TW6iFGdkpDOcDScxatAcCLPw6rdfS+Lr7s4Qzr5w+6+//OQsB6cT7xPTbxf/Mo4hFtRCX81vWHFpGD0JIpxU+n7iQB+r9QIzyRD3S14XwasgmhJ7P86IJUKeAzQ4q8gJ3MEh0NKCAvcarK94SkPd33NHdDTbDaZetOteOw95e9dNPzE0cp5LZwfqBmGKuuuaQx2SFq/R94a/h0YlL+KZD+hoNPKBJYrZtmIrfCRGqn7LwgTqJVx8HjiG9pe24PeB8IFp1j/8hGQdk8+M5iLHNsRA6B8fiVYwe2PgOAGtBzWGQUarRGMAlrdxKMVFH6kDueB2o01QI9VD44L9MP7HsDp3vePyti3EsHPJJ8m9aPr3y7oE8dsloGwLV/wCHaZmY3aRFWx11QuZdGg8Ac655PpDXGKT3IATkuI7wSCZAiPQupNkcqBbyCmOo5IQDBpzPfcnebwFTq6XjIw6AcdeYxltz2lCZFpQTrQJCiAH2CZLP8V3U0Ryx/i53wC12zmR84QP9G5441nku/f6b5+Ua95dnwn0M+8nnD49eFsaISsdPsHVHHfvn4Sc8TR4jHqtQEGzxx68RhbK/GK9oqI5q8xPGb7SO1m7o0W+v8GULq4wyx7ffWWI0GKTw/ePmf1sIkeg/zxnwu854+NujgoPUMVbHtz+y0hsyeYOlYBiesCWe/xD/Y8Zb5vgUitOn+kSOdUrwKW6HFoww1w5xr04NTls9xG2uHVEYilu2dGzuTYm+tMl7cN9omdKnVNjGtP6b71Lmh+BWbAaWJYAY6zqzHNWrz27uHTGeIAHLMmJxM1SZn+/6t3WMTcGLxnWqclWKt7/5tTJVW5h36zLP5+QfLuiyyRW2rhdr/JnSBv7yrTxtYWXqr9+8rVD6lBKv+7QrtaJytYx8Lw8kZB5f9ueertHO+Py4FU4JPsFtfnVFZarrtNvLs43ku4LHNaV3D2Qyu+n//80wL7+XzdzJXj7D/N//dDefdE3jyJUOfbVJuB+ILq8If/uhUK1W2wtnuvyx8+PLkuTnsluEf2pvjQr76Uw93+fLJvYn0vmvJNucpq2dL029lSqdHlLiOH+/GY1lkf5Hli1uTRuwbECXoYZiGssQlFuXRVPz/QuF/0Mgz7x1xtzYmD7/U1PJHzbH8EKbesLInI/kNBG2KZ9OMhBG1UC+OqRZyBdpVlur+xb3ckT13JO+uR6N5ioR1UUHzduYWShJJCSrfuW73jLJMKWB77N2hkbDmv89Yxykketzkl/aGfeH/sECzbJR6T0/+6KGV/0VvfNFoIHf/3dcmdZtDX39Z0vy47DZsQ8bNPOCDTXGqoS57sp/RCZP7ywh4vXwoO7guDKrZYP5spZTPxIahQb7hxGrgje32WYS0wxDtm3kxU8zE/rkmMI/DwvqZvxPU53ZbCbF2va6pzC11AQxCV8kJZZGFSdk19i3ct6tYRnZnHSJb2bMgvi17qz+DkEs5Y6WJ5lLohoS8qpqErJ/H55JvUtVR/zmKXNEPm/qrqMjQmZqG/Wc7ew3mRUBf6Zf5y9zN5MIIbgrIXb+jIKu4OXDQ2aL3kKsfHy2qnmgvMAkzbq9SveKPvLHlJDcFSG1q6wfRuo/1osYR3iKUXfBFP6dNtwXZqQ8M3au7rjB9EFTiG1xyLi15HKE/hWdiBoFHdr3wiMuK7dJMcT8nghdZ43JJ1eqRtYWpbZvU9SXohoz32OEc5Z9Tubl1ySSlX99vbcoL2S4ffFp0UjJay8zzn2WcwLzHt6TBr25YsLMITzTtcK0X6s5SwLFRx+mJbEPUdoQXVK8fHVhp3ti/N8+2dbq7W0d+vlCUx8KtjF5rsmvx3w0CU+e5qxb5zUP/9QHpQf3MfAj7yoDx7eMDc1tXCiV/yoRnTpp79v6l893akZPiKQ3pKo9WarI8yM77+7OicTrTAJHTp02Sj6XqYfh3IUzZ5Rnzp67gGF8zFsnv07suXOOosP106BhPxSt2TcuamTGxTVTts55LyR5lO1UkPHTknXb13rtlO1z/Xk7PUk1J43zRk/t7LEnoql9R/nSgql3d29XaCIiNcMl7fEDE7fti+mIGzH2wF719JIJ+cHFjmyHy2x3rFez+d9pYVKxP5qbw+z0dH3A/lQU+WqZnOhWWjVspV2nI5SIGPm0qd/3K57Vqlm7qXT4/sVz+x9RL7MRH8xe2SlpjtPsGlguyy9TNfwOdPJR++Vz25aw/rrOzjfCxt5kl8xuiswnzOxZ/NS72W90e/nS1WvGsNQIrjenLyF1dR3aKhjf9xfzX5l9777/3nt5ZE4XoSmPJ5WuV2h6adYpppQ+jlL1qaa32jLms3nh6LCOjmHCnU6N6ei7JpFg6Oj0ywovh0f8UCjzd3YYBJHp3aMmTecdAbVFzHStoByImTDeNn6CuA3vc+r1BS2YOH3V/FXTMbGlgLmJI/7N/OgD/Dilri+PAWFqcfr+8JgFtANA2vOJ9A47A6M6ysDPCdXjWZ4loM6403JKgKLQeChEkxCFUaI0G9XE7DyDNFlFkFqYw0EYNqbo/bPjaiDQ4Pzp1XtkDjayo5+/MNI5ncuRxBwqCLuYQIkJs5qBb5Sj43xeRqLpdRiPyZSXFvXskZhgimQId7jW2oKs3u5Y01Bnyzw2Spl7Z7nm20lbwDMCAUCAWXM1sjZVr/tiGfM/AHx/apME7vKZ7tlu0ctcJQAxKEBEKZoooZH3ChpeTGOFE4YwDk9AY/OyBk/K1Icz24hWJg5e8j1+h5jWpaZbMBEYWgvzf/dTFdxnurZvMPsC1TK3F2mp6EgajzS2lzXwXjM7jTrYharxe06dLPTHKDvAz/0Hr43eROIBaMQASZTWXwGnA3QNakwEIMg2IAwwEmUzocrKGgQyVBkUIjQbDKzob7DQYb7BQYFNU/JVhoJ4sN9QIpT8MKVahKJxmGhkJf12k7tZg8BI1xkUSnrEYJBPLxosomm3wSGUiZqSXxsKOojJMJRI5vZNqV4TzXj/LAavtdn0k61FfsZlasKuNXMm9UdBVcXXqOIQVVhIyHjp1YEW6Mhfby9gk6HfLIu9TA/dfEfkiy6Nk1AHpEx+W6vUmk2bJ/FlRoqKTj+3pTLRnHDEpjcFCoqmby18O629RctVNo02KXovh03MsV9en7WJzWQeX/UijqFpTGa9/ecB2hMxx5uiFBxmyxfrN/GtX9TLbnWewheTn02eg1/q10HXkL0dIK+Ozbi0/gYN+i+1uVMruBkvKx/33cC0YkcWJQ9SbBpocinW8hlOxaAw5F10bgw80IY8Z0GYgxmsHI4x34kqYpUvZBIxxl4BcdGpx4sjHg99vR3kpJPe8+3OfA05Y9PwktxJSV6MxJVekTqwmUZ+PykQ+ZmQjhkUs0ji0awsmnNW5faMVbEZPnTiOmoFSYE8olLN/pe004avJjSjIk6FdhMK57kohrJqEowmXVPxAAzgwEkHhzXSu+UY1n04luISObVLzA8HFHj4QycDSFyDkjUdusA1+pJTQYJSkmdQmC1bsLHQJ2Q+9ZIJ5Ko7GimgLOVqiu4EFJiUu4rOaFOCWSQSWuztsqFXx1xEF241TljRZV3HrUGPElcgpxn6uk9sxkuy8x/CeepyZzdF+B368fnV7nS/T4nRfugHjNEEXOPb11a8adkut8fx+vw0tHT0DIyCBAsROscbsi5OZ5YzeeMep1syrmPYgIG/wCgrbHG7XU7Y0p2j5ibytsxxqi7VrXh28Di9arqapWTvkJbnTaH0y3I6QXWpbjWZpO6Rl5+fq+bdVT5KLuD96voAIcsbTpIfs48+KgA+OwDEwtHFl7kIQLKPZ5AbsJGFVfUnMxfWEzCAREcuiWeBsGzQv7YeizfMngOQx14g3Y9dFqCFATcgFwAAAA==) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABkkAA4AAAAAL4wAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAAOlAAAAE4AAABgRWJbumNtYXAAAA7kAAAAyQAAAdqK1xeEY3Z0IAAAFaQAAAAKAAAADAAAAABmcGdtAAAPsAAABYwAAAuX1RTb8Gdhc3AAABkcAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAAwCAAAWjK6904RoZWFkAAANwAAAADYAAAA2FFN06WhoZWEAAA50AAAAHwAAACQJfAGCaG10eAAADfgAAAB5AAAArH3JAgZsb2NhAAANaAAAAFgAAABYadFve21heHAAAA1IAAAAIAAAACAAyAxmbmFtZQAAFbAAAAK/AAAG50rK5LZwb3N0AAAYcAAAAKkAAAFCunBaJXByZXAAABU8AAAAaAAAAH/i0Eg6eNrlWAVg21gS1fwvsGXLtmxBwLEMiexwYll2aZOmFGjKzHhQ5i6Wl5nhmJnTHDMzM/My826s3khO2vSY73Y34tHov5k3k/l/zBAmzzDMF4nKUEZgfMM8CwzpaLZkS85aciZ/6+Z8nqjle/PwXgaYk+VzSSd7mIkz/FCQQEczKELGNLOmXShFS5amKgIv8JRXFT2qa6STj7/49sZCYfF34ryUSL4z5fOZv5fKRym/7NlbP/LLX3wMrGGesqFU7h7nmjkHDs5xFj4VYhAnUz4XXoM4CcSRXJxYoWhZmqa7CETIpE27WCrGinYhS7IIn/FJ0iiSFBIg+HvT50u9M5kIsnt9rIv1q59/zPnaMOuD0FPwrjkHD8yBffc0Jj2sCejTI4glIRbPuFjoDVMqut4wAj9XI9dQKmvlfZSiphbgf0BFoolP56iIX/8SLf0Cfi3g1+B9LVtqBo9f3nkS2RIE6+l1FuqVRlFCqOcHj7lMOmsyWbNo5XWNIY/oEQTYBxAOBHlKrilfVyWy/I+5QFikTzfiCJHyucyTo0gUXCQbA4RH5M47T7KzraeetvjXot65iJRBvXmo1+AhIV8uSWY7Mb1roVjCrZsUXBLdA521dFXh3eCFiaLixT0EQdd0xT1UHc+4aSrJ8JIUHDJYACCckN4isqy4JS1wBIAFdXXzZF8gxFOfafSGUURB32bxYvDlCbwFEu41TB8tH+LZ7v1y0zceCVSFl1hUqPJRa0m4OvBw/cSXhyjMmVitET4kcTSs53vFh5u6rw0BLJ9WTSnfdRAgdG1300OB3rweppw0zuMB9Lh+LFvyFYtVZczyinvomVK5uklU6CKlIrof9c6lUrZCUOXURs/lwpLU1bYgxoFgN9t+Sv3JmmUB4GIL2rokKcSzbJAtzBeBQLCtubE94N/bGvO71IA4v4DvWHZrmOM0o9SvPXS3MKPUXMVyQYljw0rPSuHuh7T+kqFxfMjvpyzRF1hB+JGU7zESMZbt7I0n5aavPyJYC3TCUj/DwKlniU3voyyjoZ8+Fv2keTSb1RU+49qbTQs8xixtcvDDZxrgMS5ADOPIxMfpoxOPGAYJkFV9i6W3AM34fenw9OnhtM+fQfYYsoneSR5g2nFUXXbzxcprHmdW3k0NpEXTdRzayyLcMojjISGkqwAdcm5mtmV1R9CcO/+cDsoTQjlf/bLL5rR3xu217WeL50/pIfcHguEUT+rUKjcrfP5ItLlVEmJni3KKysBIjNgMO95n+PM+j8T+Aadx3Cqy6dSpf8Xrct9/zmtmgtPFfo6+n2lA65Ke15plqSkbbSvJKTk27sl0bcvYKRUNZNOxS0UnIh6qoU4ATt8HqqvNksheI57QnC8tKRYH/ewHym8ov7FyuymeCISLxcXMONws4kYruH8eicqpP0V+dt8ZNHgI0QAeH/fkYo8HRBPewH5wHHrJ6eK2I/pkRM95Fa6YSukJomOoK1tDSmd0TQDFSpaK3mZhRLikNwG5QWOyBTQLsoUplKwkKydJyTDNCWhhbvdXO51vOT/1wTcIQPmh78Bb01cM3LRIVXJ0yqTym8tvwlBl0pf2gAjTbpjoPAH0JLnMGExzoUZEnSFRCJQv4wlbfhMQIVq/sbaVf8PLgRCBsNncHf3QTmDFF+bCjrAbv13lg3QEK1Lt2JwCed2dTDIZdIJ6SeSWm1gNlh96t0zKv44KcpBw9mvD0aQ/Wp2rL3xzsfPaIM8ejrJPD5YETvkoaYmqWV800dk0pdwGAjXhVFp0WRt5HX0PN5/pQixbcVlTBDeNNY+faKyLloqY27pSqXhY405nM26EjhXDbMFVe7NN2FiNFLLsePPKSzW9zTJShtVF6+J60qZUpOEoR5KpVC5Rvf5oUmtoaZ3a2k0StXqyXNscolQByXrm+FMkSqoXL7xkgVY1rbMulaxqDrHUR0Twr1r5lRtfXv5J2Tkyffek7hkd8VSSIa4P3Cc9Hw7hGmT/Ilsh/6If3P+GBBL57/NX9c/yTl3ehY+O8v5RRvzA0I0u9/Rf5/6FFDgYeW7E/F/PFa/OLGBezBzEXNm1ZePSvsQf5Uqs0gtgJbZKUVfwV6JHK8t5nhcyAjkrjNBFSq4Wytzlm57HARsKWV4IEcHCBxz1TKTbOuY0tLUld0wX/UubWq2sRX1/lvuOQbOtzdiJagtbW60z0fMJNTHC1be09QR5XpmrAaHV0HbEX+3K2WDV9DUSGRenb0O7OXn6ogWzOqfyLXD08lumFfzwpwRe5/zcnDRrwaLpnT18i3Pry2+ZUSGSvsM4uorTtPl5faq+zJJC8sXNl/bVX5c4vorjIy/ui1TmQdag7/dmD6XSZXnLEGCEUR6LTKnSNugaa8SVRIh1tjvbqJRQ6oDCZ0jQiIcIfI6AsyuWqOXZ657dxdbWKQLr5zS2uoo+8zuBMn8OaXTlDN74XnQQc7RRKdWqhsTDjXAbhOuUOBBnMpHidWHinEOBXhwzaoLPHmRvJjWJmECFZ35Hq2oop4r0NM4w04Y4YW8+rKzP3T0WwUBj5E05gukxGnb5tNDLIuLTCsEbdg9sCHEAQOPpWhZA/O0b+mftvMoHwNam4xQAqq4/SochsqT0qhV1i5yjzkRW1jWZhY/CJ8QbvleTO7lbdHqcGays6Sj9Anwx8Jlzt1R46PZ46DjdQRRd//HjCFo4mnJyBC+ekIx1EGO9Ao1MILVROV6xamDWjvFWBbKzb9p2boux9JWT1qtoP70u4lrlzHB6xqyCT8BHXasinDPRmRBYOXhdv8UFF3VvvaxuERyFLzCjneYpXFNwZzrNFHaavwTjvkqf2cJUukRod7XOdIkpOSNHwLC8HpH/7l8Yy3J7Vssb6ukW68+OhDope8RyflV+G/9dbDfdkXZj7xVArRrUUnnUKtmxaMljT1Cpu16OxVTNo4ruft8ranm/GAzBUG6dpg0NQVgMB2pf8VgI3g37Zwb8YVFw5m38bbHozHHmC4GwMhP2I8ZStMTtnXXECHrWpk2EiRUIGW2fEYNiUHaLERgaet8QgVAgIsAHhoc/AEL53IgowHtgCOAdcFIQZQmcXmd2yBlwekFiGIqr3m7uXZiddcwUZgAr28zuNkMGilk6ro2shBzdqK9UuFKRO13J3CZzXOdQtAtoGOC/ktd2Ztw8Jq9ItE0OnNj60x0D5tSbX/nF+t2ZIefuQXy45dWwLGC1a++99KLJiXl9j706WpeI7tzw4lc1tbzx8LnOnXau3rKyqXYfwfILofxLfnzzG/fv/vCFJ2o4ruobt1YeLpkFrL532xtWr3/1NRe9PkSI2Nr+pq279r0Z5MHe8nDOIvlsLp+tCzIMN87fRmYi08ssYcJTg4P9kye1tRoJGbi/5XhMzqCEuH6nwMxk5VTStk0Td/QaH1QV/faaKSikUnKFFNz+GgcPkRbzfSMGBzG4IcryEMMNpIs2HXPudO537nfvN1/yDnKt+8BvW4PsVAe5v0ZI+SaSZf0556lPJIJA6gmUfwSE+OihH81e9+xLSHbsYbNMGtx3YgsS1t2bOIufdqabmc9sdvlZu7i355x8k/F38IOJUckMFeeuUqngVu5sRaB4HWYRTGRQYHQvYWxUoJpp6mlGVbxBK3n0t1ImFvS9+ZLGZds+/elPNx53fuU4x/lcUm2ZJ9ZUscdp3A/Lt34ayKiwegf/hS9y4BwqRM6/LToleuuFEeuv5xNI6+Pschz9M2x8dflDwB6bUrB27XvVNbH6zDFyKIivnJExWfPIL/gvfZF3LgJiinMw/0JzRJNhyLjKuhlX9nOsekL+ieoKox+oqsu7Szq+RpZVZUzRtjNp784ueD9n2YV/oCLDZ9lqT3fLdhrRayVDsNQtwIXjdSEOtqiWYEi1eoRu3/JPlG7nNe4n+C3QWtmQBNi6NO6vqfHHl24FQTLkWoqo4+fi4p/MQXJqjBw1TrQ4yyuKqqLjqQYza08h5hS2WCjYE0Z9oPXopzdBCgbn2E4x4Ts955SvLF9FDpCDaLAmK0rvmvMO3XDpDYfOW9OrKIaAxNSeLXQjiH/Qwmwe/X2Yq/w+3GlbqoXH5srf368Hrh5qod7Y3OPquO/+AMfzgJUAAAABAAAAKwC9AAUAAAAAAAIAAAAQAHcAAAAgC5cAAAAAAAAAFgAWABYAFgBKAIAAnwCzANQA6AFhAdUB1QIAAk8CewLKAwYDRQOqA+AEQgT+BhQGyQb+BzIHggfUB+cH+ggMCB8IUQiBCPkJiQovCsQLEAskCzgLRgABAAAAAQAAf0Tz9V8PPPUACwPoAAAAANiymQkAAAAA2LKZCfwT/KIHvAVQAAAACAACAAAAAAAAeNpVyjEOAUEUxvH/zOyqJ9HolbbSvClcQYkD0NM5jNYRHEa5nT0Dgu9JRqL45f/y8nFnDhCWoJu44iLTNKOEK71qao4njs43aXg/0gDwHMukeVFce8b038cOaxbYqGDfe/MvZnrJv245yLq9Uaq6DR04dvABg04iLgAAAHjaY2BkYGAN+LOIIYrN4o/wvxr2PUARVKANAJIcBgUAeNpjYGK2Z5zAwMrAwNTFtIeBgaEHQjM+YDBkZGJAAg0MDO8FGN68hfED0lxTGBwYFN7/Z1b4b8EQxRrAHKfAwNAfxwzXosDACAD6LQ+wAAB42mNgYGCGYhkGRgYQuALkMYL5LAw7gLQWgwKQxQUkNRn0GWIZqhlqGRYwHWO6w8ysJKgkpaSndFiZW/2lFpMWixbb+////zMwANVqANVGI6llUuIHqtVWOqDMof5CiwGs9i9Q8eP/d/5f/7/mf///vv85f93/Gv3lvcd099fdV3cj74resLymfE3pmqKANtBFJABGNiCGsZmABBO6ApCXIYCFFUyxkWA8OwcnXnkuBm4GcoGwIIMojC0CoXhI0M7LB2MBAO5wM9cAAAB42qxV5ZrjyA4th5phGHxBnpr07ZuUPcxsx8nwNH6fa9Fu+r28+wx+GjnL//bR9shJc/dyQ1SlUklHR1KFlSFWq0lsiV79pKYXX3Fj+b2Eb7o8b9MtylcTrjSzn0fVqFpf12uu57GyrCLd6StHRWnos2OY0i2fK4Y2iH9Z4Nrce/15ZzyK1+Ol9xNPe26eEC8sJB4/tS7xXVndtZaKgVG2wfNQDXfEV+X8KizhLCGAyDPi8YUkhYbkbFxWt2V1O3VTa63LTttazWoh2bTW56oh+Kk1MwCqRwsJ13XIDR0CvmUn9blmNHDRRlFfC0lOBsHlk1Uar3O15UEfUU45fBdX602ktZikC262ZBNtcfp0OcGRi6S2I/tcNzwStfuqMqCmga0ONbHSYcaVtS121hGf6y2fRwwJyIlo/aeaWiPxwE9TKyZppwQ5avojEyqKw5a3Q/aY2U/+eOkFODT0yDilONcZbQyZUq6wyeQC5DZKrjZ11hmEmDjmOl/GLYVbR12aNGVC/Ynxapx4rvZsy/N5yhSVSswbWcfnaQNDIp6MXsp1LHRoeUp2S9hNYefzDNzMlpQQGFhHXJ6OUspT4mmQ5vOsebWSFLWNjr3MU5v6G59PmFeLyavlgdL1oD9V6k+aQs1Eq0kxMxOxk4U805YmReuGxaR8TOGDnbOakMdCUgh5yDbMcyrDtjyNa9trd3COK/gvNRaZ9IC/B+3+Uh1TwEKpUxpsRawe9x3HKWt1yqhCVeKVhGd0SDFP6JDHwW8aUorw38/OOmpahWGeFicbbf6y7V4CTaeR26m2z2dM4Yg8C55FnjNFVeR5U9REXjBFXeRFUzREuqYYEfkvU4yK/LcpxkT+31DAzoc+t8rFpz63y8VnPv/HKJ5q/wWM/wXG/8A3AaNIDxhFXgJGkRoYRV4GRpFNYBQ5B4wi/weMIueBUaQx9LBsNd8g7GxKkcY2knJAspF+Cwz7bfYxSVcMUY+OqYTO7mp5xn7TAq3k89Wd8jhn+UqrqDtn4uSqLRO8VjJz7PF1Q7dKvDdg58SHg2DCEPxovTr7nZKfzmN9t7junEFGN5E/9Y7ByyrK7vp8ywTnHvp8+/dM2YnWYX4HJVFnmxRQj5WWzn6R5z3d0xkla8ifHUz0bcc5cxrx7xqgwoDgrzThsai9mQea6GEOX/d2jykY+OCaDsWKOJV5f7qYfFuhKrnfVuaqF20ob+BoRLkurXUX04dqHkBLYGPw2FeidENzNco2FhJsMhfrVN6gg3cyTQg9p7uooUaELvKCKKOkdFQQLVE0TlJIrqOh6oe8wqNk1CxB4HNh8MrtxkLJ7wsHBE19bsiBfghqHogaueoQZ13dk2BSrYeiLxMYMqpWkoAeas+FZlsJZ7uUN5rYvdj77Tso1FEdPKyMljZ+NEQQbZcmla/ngylul/Kx0RQIa108zA9tUATOaQzgkx31wl710/3WR9o8M3y3faTT0PC9do7A0ixAe9gGZQk4gGm002Fgd6cFNVo90HeH7jp4NPCG/4VW7P1T3Sfws7uApfGE7Km3Z4cYYyFjO/+u5O/pIQH67v6Ue0j5zGA4+0rm8FTANzGLz4/RvzCFck6f4ltYvzR8B+KVsBaDV+rmQPFrj/WAHEEABFA0xj1STOcCsb22OWv7WIMLbv9R8XXVH9Pf7L9wO5p/yojY+p5RRBWHICb24QGIKw5BguZDkaQBKRqQpgEZmhdFlgbkaECeBhRo3hRFGlCiAWUaUKH5VFRpQI0G1GlAg+ZV0aQBLRrQpgGGmLfhae4wmI+qrqsnVY8zw/CsQ1/Mu7AeMLj1ELn1CLnpWMz7MJ0wuOkUuekMuelczIcwXTC46RK56Qq56Vqcy5Oj4Ofp9dq8MMzjq/gu+Kbc7AERbE1geNpj8N7BcCIoYiMjY1/kBsadHAwcDMkFGxnYnDYyMGhBaA4UeicDAwMnMouZwWWjCmNHYMQGh46IjcwpLhvVQLxdHA0MjCwOHckhESAlkUCwkYFHawfj/9YNLL0bmYC6WFNcAJhIJBt42mNAAgAADAABAAB42kzMtYFCYRAE4PntDncPsQYgxiF/ORFWChWgIW4VUAp1kOODbPStDYCI8EDgVRZACzhh0RL/aNIKKbRpjSD6tIEbU/rvZ+4WOaxpDxLiRPt+8v3PfAWh7QDm4kwLROSQlvDIA63QkEdaIyuvtEFCZei/n7lb9lSR9iBvVrTvJ9//yK/eWqOK5ciBGPrO/grdljxtWA4zM99SHY8y7sRUdg9+/SodpuUyvZIftKSyGtamk1p6m7yjOAy/t+IwCmmBG9MpaD8xXCTs02qRKO8pOfp0Rf5G66kuaDbRbc6H6/qAT073zYjjPe50M10vlYVdKusOU6xCGqMHjNYN5YXSEdeNKQsKVag+vXJK/8Vj0tuJfr+vcm3TCz1Qkjz17reOfiO8lJK+rlyLfa9vbEp73HDd4zZdNURbOueHrSjPO0hNc/1zvzy3fV0zSSEzCReNyLpFm2uyKdP+6gZtV1xckzeuCT7dthypSInZvZZ0T5tMn2VM7iSalmZ3SdsxL7W2GguCJqlNZRvVmOzqyMH20sbrfzCPEhWGqGHQQQoLwlskeCffGKFc39FyKJKHsABG47gFCPtIBLPgRN6+VFYdVvB+6Rzh053zN6mtC0c711kkgtpg5KJfF3wg+ASnkmcwEhxjDyyuXWTQkrAkWQWs+9ZSZ5eh3InHQK94tB67/CbrCCxvmYHLJMlQ7vn0h7P0f3+azmcCfXcp5NCw4n8h3wHUTc9TePcfp/448fKGpR9yHiX78IRp3LnITaxxc+qBhU93GyJsQYuaX92KEidP6qlUmkfKfUHngvpuD+Jww8jkm7i5NTdpXcFtl0/uROzUq9iQ7zYqx33ovPHIwQc923IE5R53shdzCRo9eYzUNc7kLbUHM9EucRa7DluMwZO6lasSHMjVIHF7q2AFK5ee3U05wLboN/5G8wPUoVjhAHjabME3AYMAAADB//Teu4Vs2ZNghOIFE7QVT6AGDHDHCAC6lA9D3oCMGLNmw4kffwIiEkc0tI6dUDglp6Zy5tyFS1eu3bh1596DR0+evXj15t2HT1/zviW5NkAAhoIAWrPNF7SL74G7w/zRq97J/3EmstRVksnvfNvtt8/7pi0iTEPxMMA49AQZCtSu0hKuoIWuu4hLOH5LBBkKnMJ5M6YUYISpAMYdQXoAAAAAAQAB//8ADw==) format("woff"),url(/static/KaTeX_Size2-Regular-d1e8ff17527d885764046b575c601f0a.ttf) format("truetype")}@font-face{font-family:KaTeX_Size3;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAAA6QAA4AAAAAH9QAAA45AAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAgyoIDAmXFxEICo9sjCIBNgIkA2wLOAAEIAWNZweBOgx/G9wcIwM1cpLygPzVAU9E7KH/ABI8lwixYgQOkSq8jpPrfIt+4YeKd9P56rNV5+O9xBGSzPrP02b+uW+EYQSGMMgSd4iYL4SY1YWskdbJrkcqZtn2i0mSijvEP97uv200Hg4kwcQSizVLLZDiH/4fbf2sKMHT3PDAN4PYl8GyBv6dBM3sl6KmqKerTga3zKY7tgOEqz3DTVGHRt8H4VF90pT5vzklMOrLQnIlxAtxAe3QyeRNbf83V2X//+mhWpUlkFkET2BJARlTXZ3ql0pNBhDTi9A9C4QKUJEjOABSwPIUuxX2hDplTsizbUgklYt9bLlTT3iLsamrNEC+uGfJ8m2AsfvpMASARdjPAewP3ZheRnExdKOGgY90vP8BPs3Aia0LaEDSF+WSomvGhPu440nAoSkO3dJJCAA31HFxE7hD09rkcdXnkUDHwYIk2QpNYhf24Bb2R/Y8x6V4UpXMdz6KvoD8JFmM0ceR1UuZb3/0w/iHee357QcOHTz9h/YfvD9oL3z1gvx0gR4LwqyURJAlEdsum/UEOJi8gNMEEbNZNklmzHUZCpjNTIKKaWkW/EpdFlDgKU2z9OYflu/eID58SpQckPVWTtQHEiy6/5LNWnNoC+c9eAOyyQCYSgwQSSpPAow6Er/egk+fhizImh5Odz4nb971I2JgK3kashMV4aaKt6w6L++OyArKOGdQkVtEC7/26UR9pHNAViXmJqW6cpjKoOwXUHLODso5G7hNxzkHOGoq+OiOhKCthOAR0aPzPkNlgKd58zqqQh11sNWLcR4oVzncxGe+FKlP+n9kOdeiqXT4tJ3Klut2crLsRcNugrLLltTN+5oCMenWgB44IDom+XJMwGMHq0+gBioRJgETpalQdPiPt1oyKmgomSizTMx8ksTBtGCaxpsebjBvDH+yLOeVKRsQfBRN+9RKR1hl4ADPVpIOaECIz6qwbqJkZxQB6aTVIWIuQBVZ+pIGZb5fJO/M55s+oLGyXsFCNwlYCJUSql7Pg7DBY0aL4z1qiwesFDooT9U/3po+tcKion5GiFPAnqrzzV6qfDvJl9E6+xEDW9V2erO7TXd+Gfa+Y1ixon3H+n0+VEWsOQPBIlZ1gdrToW0TXGylSqYCL4V9RIqXmXiDqliyowAWtKGDP6NqjtaC8SjOaosLX7LCTtkEErgYCNj/AuxcqugVewmrR01RPCI7KKMKVP3WV5exbDexn6kx07lccMtdygGDFRu3Ag5WCoGTGLiIAzfxsIME8JAIsWSCOJIgnsz+bKqBvoaRA79GLvzd1AlcQstWYiIeY5KYQTIxSCEOUomHNBIgnUTIIBNkkgRZZHbyGrRQQn5kQS81toDwqOpQBnkl7oUpIPmZ/EmgkNJcvqiwbs2uyNpOs5zzOVDkoAfTNoWTKmBrmu7kLKYWYxOboNJLPbRY+ZgHoEJNAZTVx06pwPYvdC/O5KmtVS8cNwMlVKu5xXlA+jcKlLI51wbKiMshHRZ8a+WszLavqNEceITFqz4yt7l1SgvnM+RxKANtnb4ZqCDYhg/4ILo7Zt067gtcavsKwmiVWWqkVMB7pCsQM5f4FRu20092uprkvi+RVj05RhOS1KfS59ms6PEEs1dcE9lX93dhKkcGp+5Ig25657pbroWicr2hziT4ZLNuzRmSZrAAIT0HLFq41irLqYLKEaKzUckK4FOedJiRGMW+nttAW0UOVKEwiCSElGftWsKoHgrJo6SZUCf85dakhLIgMX0SHlOj1ryDTT5KCKCni+Fv8+r213ZVzDIsfeN6QfZqbUiRc9xyAx01k2FnNtTR1OB219lOUpubWgDjViKhfoyt7TTQx6a6fOOIiizW3zSiMvdJMVFcDtRXzCPg1VBATm0uY5RkISwztVJvTWBZy6hKnN0dC+N/Yl7+RAbENcyFra057/Fsn610W+EII0Bt2d6W+7G1TGN78tbFM2PAJdE5lUksmYxPR13nqAJuOqW9vGtEOYDux2F7amo061MrpDJ6RgUynW4nonc0wCYT+wjQz8hwgACDJmyKQwTYycjQT4CACXuBwwQIMjIcIcCoCRvjGAHGGRlOEGDShM1wigDTjAxnCDBrwiLOEWCekeECoRbEEmYUaJeLpptJbPCYAiHjxtliGsTUGD1IgRjIgZhWZuIEakIctEAc9EAcjEAcNgkJ2AYSsAskYB9ILHMgfl95dvfpMVmn+XKCyaVtnW9V7kO+bxAoGoUVHYuVWKbeA0y08H2oTYzT8zAYtkfLaQOE7O7E84lxTsktDXQYGSc9QZT2Ljf/U1IEhR9WODkUNmTnfUNvTm3RUvClk/6X61JWETb+/zy7JPBMYHX+yhOX1hXFce/gG5ObCPufX/h3liFH1uhXwbdCketoybX+nX7TyvK9xjUj///a/7WxEtqlQQ4pCIVX5IhzbXHr2+FnaWldWXWshja/CTyzi7SQSsqukCE7t7aGr7tt7NmQs0bmtLutu/61czu4Pv7c7bHA51IcCBvnbk9l/d9/zS0jT9/i/v92Vt6nGUb65mbg2ltHw9jcsYodeW/lKlbx3T8NDjvRGUWRgZ+kr64iXJH255pKz5AQsj6NiO24Tvl28PqX1v3ur/5ZdWbG1vB1L3oM+TebWnktGJx9RQm73ZEP5cjMy7LnuumEpe3M7eCflGXHZmCzdUNZDt6txIf9//evRJxbw1ttx+WI/45F3glffOnQ2rfOpaKVewxjzekMBkNLqPpWHeGvjRWGOGSoIeTS5F2gQglpWCymUpCmX0L/2cDE8+HJSYTviTjXpkIRSvmXpl6kJdf1+XTH6s13pLFCpECxG4Xer3etOeaLvY96pdz/PcAFEn3b+0v9BdVi/4Xni4MFVd7H3b/tSwxw/P2//cvPG5dr66OfT3vt/fvF+7/dcfXV0nkWK8eIVeLg+ReIAwXVPwurdV76sKoncZ8o2DeUV2SessreSY/p1lWSBw/uTRi0f+Yf+zjGp/hOFa3nbcA8rdX9C9Jr/6oTa393nRKVraf68pwUZHL6bY8tS+oP6m9GJq63clDExul1Gu/nK2bc/nAgYXM6M7Tb1tUiQ9doVnpnwy1pxzlmuLznvSyXtqhDZjRCn/trvOb3/i8TAlbdxo4VH5vqsE/6TNBZlRZLy8JFfdnJG/P6JZI/+4zd1vYWBZaibvy9iDH75FRHxU+e2XRRKr0ioVUVLG9MZl68aOscVmFF/dYvOCnQvTifrsmir+mGm5o6LBPxaIBVHbZ1Xrw4mfmGRd8pm0Rz6VyRvjroXgadZ1X7fA2n9x76uqLypzOe20Dn4uHZn9amXeTGjp7i/0nOT3JP3Xmqn8jrFX53Oc8tNM01cV6vKM8e5mYTS67IOceSWVn9SI9pb9rojvU/lt/+RX8bd1g4P+XekoPKI2OP9Ijh9KvdlVvnE8cuGRc7Of/70z56dG75+XkufULXnmDgPjtVKW3zn/T37lDPxZr9z1zin082RlXxJ6KU8pcqX5bDybDO+3ux1joTzMlOxFZV54o0efCZ6kRb6kUCyYL4dYl7PrG92/lOp/0hXSNNeqv5rUbRrPBWk9miuz+0Z0YUTf/bSEgwv9W08tvNGqPLDdtDyuv4WqPr3W7sFbHQbSsFX6/IBADlfzf3vHBf9PuUCHdz/LcjPRHcPTdEnsCKch+3MZrM4JkZBjELYxwZySyDMZnfrwkxFms3aKocsRghSUXWhqBbhiTlpwIBIGDj6D2PTltrvpAU7m0AePqxa+X2Zb8d+b5LuFu4D4AEBvDwCI+XYUy4I58Yff84IHT9xPoWXuXUC3j1YC/jP3bllG6gPDq+QlhRr7APcUlzL6UqE+6Ift/6AQHfjgw7yb2Ns1g7vvSUkODAvQ1TlAfMkrCgSac3YJ8Ym7qLTM9cF12psyxWwqCMWQQFgxaDCRMWh1TzFg+7KywBGq7dWkyxNPLhLssCTz2zta7BsD2KA/FmALfRZzOL4MyqxWBh91u15rTlz+JlJGoJPC19a3FmaTnxPmVZlIw7t9ZnZNvgD51n0PY3RLhkrahdqS6f3bb/uEdUcubxLxWGmoC1j0dapIb77Hj1JlPP94H24q203P7GLc+CF7khCjQeuYw1UdZ4p7nR2Rm/nTsmlpzlxisFRBVEgYTPVSyHnrQbL1mVHEzGC5s9g3irPAu/Bk5kSbzaYEPL5V8DzhJ3yeG/8BSuLN2gGqGgV6l/oGaIXP6YlnCm0zzo2OIkdyr88EYHX0tnOoD30bdaUfk70fmjlfqNk2wV62lf0U2OznCxJeIJ9oANzQ54ublFkGHl0cVBHmtHrbSJPS7IjkhjEUDl1JA32V08/BhWNZbGciFTDmO0XnVR87A/7NhKj+ha79PFyksdKLCtIp1mH1LbjGa1aGTzyUSBlO2Q681Bp4Zbb1Ew9EI3NNydfjR3F7EWkgrjTv0rIypsTyDBzlCu/ydJdtyj6fRkum3wamPditDCi4iWacBM75BSx28pA3zUL2jC1Db5RZQeJWcuFoh2vKqHkVOnH249oFEK0jRyuEMGD5qxQINNmuVftaIOtBjUG8veti4DiOh+Bo8YSttiaq4H2LFpsaSYFGVrQEVjnYUZnVjjXtSbh/hRhihXK9yhPccjau9ppD9Vwfnmd2kpqnNl3ukWGn1f8kqJrcb/lihUMZJS0pbWdYen8QxxxONOCCSSiSQyk0wKqaSZLtBEtzvjDt3Z5/a+ni8qDPsj4sQ08HrhNi4SlzGynUKFMEV6FYrFfFzh5Yo3tRd/HkoW0cGJSU9ZrXlbEE8LyGnHlC76A2Be3/0eLU8aruqMzYafER8WKMP3L4VvqAcL5vtjInW997agHv9uo5fDH7BYXYGwkAcAAAA=) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABHYAA4AAAAAH7gAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAAHnAAAAE4AAABgRbpbgGNtYXAAAAfsAAAAogAAAar/FJbOY3Z0IAAADoQAAAAKAAAADAAAAABmcGdtAAAIkAAABYwAAAuX1RTb8Gdhc3AAABHQAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAAVKAAAHzrxbewZoZWFkAAAG6AAAADYAAAA2EIN07WhoZWEAAAd8AAAAHwAAACQGBgH2aG10eAAAByAAAABbAAAAbD0F+5psb2NhAAAGsAAAADgAAAA4GmscjW1heHAAAAaQAAAAHwAAACAArwv5bmFtZQAADpAAAALCAAAG50zL6Ldwb3N0AAARVAAAAHoAAAC6UaNkMnByZXAAAA4cAAAAaAAAAH/i0Eg6eNqtVWOcJMkTzcjMyiw1Sj3asdZo7uxgrcFitP7btm3bONu2bX86W2uruvYiu/vD2RHlehUvX0T8ogglaULILTQgjEiiXyg4EDpzSsbJOJ0ZpzX9j4+l0zQobk7DuQTIveEAvVI7jTQQcb5DYeYU8GVrZ0cnYR25bMGFfKGQSQW+FNRJem5Vil4pGnlDV3TbDClnQL6rgTcK6/or52182gpHmeDVvTBGe1Z942vDtBvGequ5YNy+rXhV9PXo+iMk+ttWmyBrC7LGkbUOWX2OrO1JyOYzmapUFfEUHQUhZWtLRy5fIHBG9A09nkBWyCvW6DZkTSTkjG5oOsxq4Dc6R9ro9OKNw1/7+uriDdHpSMv1GUPwI8VVCAfYw8gVIJdBkMtrUdLypJDPpFNSMIFpkmK1lQDGvkC1pO2A+GNjdO2G6BEuwwHX5NQw2pntWm704+HwjJ3hXm6pyPtRBcfIEiNDKbLTHLQ6mWA/xO6+OxwwPti3v75PIWdX1lCFyHg5y6K1pbMDOkgnzaHyVFUKUqTKZQ8nzYTk0SMbomsb/5a0Y4JD6waY2/j38BNW0uLM2slGh+F3uh2nBg/37gzPGI6+jAxWOADVlbUwUGvJNTvNuYxjQSzafbf2ub59x/bpTyHyJ7jqzyByJSKbFRJUwTtwY1Sd0bP5fKHknqtOhUwVlgR7QLlgVB1lnEpZlUrh5vkBntSujgH9jGiIf+g7rgZo9kcW2wCU63Nn5WOAprXfmGwQ1Gyr/aDPSw8SH1/JbEkNZ+wLSfUNB/+DtW0mDVcLMfH7A0E3OLDAXPHjdsmZrzPe3L14xIQF4PQE/x6TIpGklLv+8g/4s6Pt0Y6eYPG3JlPBgRmTv78s6Il2zhy402H0A8t9l1OaVNX4aSUDSzEDHaoabjbfTStiPJSBjk2IIpXLimDVjr00W8mMWz4VCipfmDf0n2q2Fk984NuuAJTsfKq9WjLg2pzJCxMUnwj32x9IxJOCS07/UQMUYtmq9kkzff/yOryp+Uecar9oQMnf7a/qjXZE18S/MT7B4iJmou76Gcs3xaOrox29Vf3fnSi4KYUhGMDw7xz6teTK+fUNTTWG+eHjHfpV53fDgqPKIyHNaiczTjxUaXJUyURboaDxjC9lS1tri8ax7NyEz1x2GXwWnXOt2MNZ9N/o/4xzuoGNTZk6Ogae94uFCz1P5Q3oR7Tj6FbSjhFlqd87y+nIpMtJy6TxuqrUKNjcyltbpLDMj/i//Eqmq9se+uH6OdMKx+8LmPn10/5or7eHfry+a7p6QD/SzJq0KQkd9PZaXa6SzVprzgaQHaU7ZD+0lmYJe7keeB09h9a+XBAvdr+xIDi0iX7kSPRyPfC29Bz65PsgCMgXw34WYhfWI3udp9ixj7KlTuvo7CwUvGx5QlX5ROKwgFPoQ9AkHa4JGRscuhdCKmxhQ/EBzgI7HAROgWWtCUJqeuw73w5nM/1TmmlKfd9N3FDV24dd34182sunVbOzDxZHB0uzat9jlTmySqFePkdaHQsW95VmiNH8BrEyGG1fH0gVat9jfeT1YoFC5cDtiy4Pf20040RC1A/CfvoHRKUQ5WqIKuQ8t6Q8CBj1PS/wVfbZDza/SK1kzHkeza1O0Bd3ObSf9vOEG9OLVxSvEsWrilcacSfBab9i/wCu8YuVmWuX534OI2cZDtxyiTE0o1J8vwEjvgCG71j0xc2bN4MeDjQYdCFdIOgCuihGaSrBixcVL3KKFxYvgAShBA2mko9V/rBa+Q87K5cJMrh/rGzkbeOAKPuYwpXzWcaody8Bug6YdwAAeNpjYGRgYJBmCGBgYgACMCnAUA4kpbingwQAFRABtAAAAAAWABYAFgAWAFEAhwC0AMkA+gEPAZACAwIDAiwCawKUAtMDCwMeAzEDRANXA4MDsQPFA9kD5wABAAAAAQAAd4gR/V8PPPUACwPoAAAAANiymQoAAAAA2LKZCvpY/EoFpwWqAAAACAACAAAAAAAAeNpj+MVgxAAEjL4MDEA2A9MDhotArMQiwmDOJMDwHUhbAGlupncMTUDcDFLDuuT/H9YlDIxADRFAHMv8giGfyZ3hGxBzQ2iw+jogjmPUYWAAYYYUBgYASjgYwQB42mNgZGBgXfXHiyGKdcmviP9vWJcDRVCBNACq/gb/AHjaY2BiWs04gYGVgYGpi2kPAwNDD4RmfMBgyMjEgAQaGBjeCzC8eQvjB6S5pjA4MCi8/8+s8N+CIYp1FfM2BQaG/jhmuBYFBkYALwQQzQAAeNpjYGBghmIZBkYGEFgC5DGC+SwMHUBajkEAKMLHoMCgyaDPEMtQzVDLsIDpGNMdZmYlKWVu9Zfv////z8AAlNcAykcjyTMB5TnUX7z/C1Tw+P+d/9f/r/nf/7/vf85f979Gf3nvfr/LdUNPQBpoGwHAyAbEMDYTkGBCVwDyAgSwsIIpNgbiATsHJ155LgZuBmoAQQjFQ4IWXj4YCwD1UyhaAAB42qxV5ZrjyA4th5phGHxBnpr07ZuUPcxsx8nwNH6fa9Fu+r28+wx+GjnL//bR9shJc/dyQ1SlUklHR1KFlSFWq0lsiV79pKYXX3Fj+b2Eb7o8b9MtylcTrjSzn0fVqFpf12uu57GyrCLd6StHRWnos2OY0i2fK4Y2iH9Z4Nrce/15ZzyK1+Ol9xNPe26eEC8sJB4/tS7xXVndtZaKgVG2wfNQDXfEV+X8KizhLCGAyDPi8YUkhYbkbFxWt2V1O3VTa63LTttazWoh2bTW56oh+Kk1MwCqRwsJ13XIDR0CvmUn9blmNHDRRlFfC0lOBsHlk1Uar3O15UEfUU45fBdX602ktZikC262ZBNtcfp0OcGRi6S2I/tcNzwStfuqMqCmga0ONbHSYcaVtS121hGf6y2fRwwJyIlo/aeaWiPxwE9TKyZppwQ5avojEyqKw5a3Q/aY2U/+eOkFODT0yDilONcZbQyZUq6wyeQC5DZKrjZ11hmEmDjmOl/GLYVbR12aNGVC/Ynxapx4rvZsy/N5yhSVSswbWcfnaQNDIp6MXsp1LHRoeUp2S9hNYefzDNzMlpQQGFhHXJ6OUspT4mmQ5vOsebWSFLWNjr3MU5v6G59PmFeLyavlgdL1oD9V6k+aQs1Eq0kxMxOxk4U805YmReuGxaR8TOGDnbOakMdCUgh5yDbMcyrDtjyNa9trd3COK/gvNRaZ9IC/B+3+Uh1TwEKpUxpsRawe9x3HKWt1yqhCVeKVhGd0SDFP6JDHwW8aUorw38/OOmpahWGeFicbbf6y7V4CTaeR26m2z2dM4Yg8C55FnjNFVeR5U9REXjBFXeRFUzREuqYYEfkvU4yK/LcpxkT+31DAzoc+t8rFpz63y8VnPv/HKJ5q/wWM/wXG/8A3AaNIDxhFXgJGkRoYRV4GRpFNYBQ5B4wi/weMIueBUaQx9LBsNd8g7GxKkcY2knJAspF+Cwz7bfYxSVcMUY+OqYTO7mp5xn7TAq3k89Wd8jhn+UqrqDtn4uSqLRO8VjJz7PF1Q7dKvDdg58SHg2DCEPxovTr7nZKfzmN9t7junEFGN5E/9Y7ByyrK7vp8ywTnHvp8+/dM2YnWYX4HJVFnmxRQj5WWzn6R5z3d0xkla8ifHUz0bcc5cxrx7xqgwoDgrzThsai9mQea6GEOX/d2jykY+OCaDsWKOJV5f7qYfFuhKrnfVuaqF20ob+BoRLkurXUX04dqHkBLYGPw2FeidENzNco2FhJsMhfrVN6gg3cyTQg9p7uooUaELvKCKKOkdFQQLVE0TlJIrqOh6oe8wqNk1CxB4HNh8MrtxkLJ7wsHBE19bsiBfghqHogaueoQZ13dk2BSrYeiLxMYMqpWkoAeas+FZlsJZ7uUN5rYvdj77Tso1FEdPKyMljZ+NEQQbZcmla/ngylul/Kx0RQIa108zA9tUATOaQzgkx31wl710/3WR9o8M3y3faTT0PC9do7A0ixAe9gGZQk4gGm002Fgd6cFNVo90HeH7jp4NPCG/4VW7P1T3Sfws7uApfGE7Km3Z4cYYyFjO/+u5O/pIQH67v6Ue0j5zGA4+0rm8FTANzGLz4/RvzCFck6f4ltYvzR8B+KVsBaDV+rmQPFrj/WAHEEABFA0xj1STOcCsb22OWv7WIMLbv9R8XXVH9Pf7L9wO5p/yojY+p5RRBWHICb24QGIKw5BguZDkaQBKRqQpgEZmhdFlgbkaECeBhRo3hRFGlCiAWUaUKH5VFRpQI0G1GlAg+ZV0aQBLRrQpgGGmLfhae4wmI+qrqsnVY8zw/CsQ1/Mu7AeMLj1ELn1CLnpWMz7MJ0wuOkUuekMuelczIcwXTC46RK56Qq56Vqcy5Oj4Ofp9dq8MMzjq/gu+Kbc7AERbE1geNpj8N7BcCIoYiMjY1/kBsadHAwcDMkFGxnYnDYyMGhBaA4UeicDAwMnMouZwWWjCmNHYMQGh46IjcwpLhvVQLxdHA0MjCwOHckhESAlkUCwkYFHawfj/9YNLL0bmYC6WFNcAJhIJBt42mNAAgAADAABAAB42kzMtYFCYRAE4PntDncPsQYgxiF/ORFWChWgIW4VUAp1kOODbPStDYCI8EDgVRZACzhh0RL/aNIKKbRpjSD6tIEbU/rvZ+4WOaxpDxLiRPt+8v3PfAWh7QDm4kwLROSQlvDIA63QkEdaIyuvtEFCZei/n7lb9lSR9iBvVrTvJ9//yK/eWqPCnsSBIPo+91fMR0nKUpAPSowJOUNCIBLFGL+ZtYx0tZSmu1D11984cB7cSc67XDbbfXl9897s7LJ8rdw8C3SUNqiTJKfNTtJO6IK9mxc0TR0XKcc0LFIT/Spud9/FJzTKbEH91M548TqyN3x3P3VvfHzN81Vuq8GyCINlNWfqmIR6tKNobiWfULdcebcsKDGJ6R7oMv60TTo6q+vaLGzInuyLkeTzxpda3xY+C2U3zKY4jmoXMrpmz9WaZ/R+Ibq0C969iomim8z5zc/p8jHUtmISIncpF17KVsWMKwoZ03Q4pknJxUY83ghi+nHltmkbMftZS3ZtXW4fcibtxNKgf0U29KIshLLXavm0cmXwxrv8veXWZDA+/AffsESJV1RwmCNDAOEIKRpydpDIOkVTUVs24QIMr9oChClSwSw4lW8szFCxQfRH5za6H84nwo1EY9W1j1TQDIyF1I8E3wi+w73kObwJPsY1WFxXyGElYSBZBYKelfCsGUY77oEOeDT3Xb6ougXL18NpJkmG0d39y1nGX5+m+pyh1mWwgEUQ/yc5X2C2dz5H4z9OfT/xeauye5rd5BiRKJ32RToxr3Nag0VPHy9EuISVaj74KkacIuEzYfxe5VTQo6Ba34FBW0UuZ6pz89u0leCZ5pN2xFo9xFjOCUrV7jqP9xxi0G+v3IbRrZ19mkuwWMt2wls8yFe4nZlYTezjSnFAD5HwQVYpuCXLI9V3KxEEG03PP6bcwkTqx/9S8x3ziVjpAAB42m1JxQHCQBCcucMdvhSBu2sXuLtXQC30BM1gyT6zMgoFYz53JGE1UQCEgoYXPkRQRQ119DGkwhMvatrwoJ0OOumimx566aPfeduv4vFG3OBUPOm+rrbT2eSwG/+TZCqeFy4IN4SbBuc6eWGj73S7beGOcPcL1/sicgAAAAEAAf//AA8=) format("woff"),url(data:font/ttf;base64,AAEAAAAOAIAAAwBgT1MvMkW6W4AAAAncAAAAYGNtYXD/FJbOAAAKPAAAAapjdnQgAAAAAAAAGAAAAAAMZnBnbdUU2/AAAAvoAAALl2dhc3AAAAAQAAAfsAAAAAhnbHlmvFt7BgAAAOwAAAfOaGVhZBCDdO0AAAkUAAAANmhoZWEGBgH2AAAJuAAAACRobXR4PQX7mgAACUwAAABsbG9jYRprHI0AAAjcAAAAOG1heHAArwv5AAAIvAAAACBuYW1lTMvotwAAGAwAAAbncG9zdFGjZDIAAB70AAAAunByZXDi0Eg6AAAXgAAAAH8AAgAyAAAAyAIVAAMABwAItQYEAQACMCszETMRJzMRIzKWZDIyAhX96zIBsQABANH8SwK9BaoAHgAGsxECATArARQHIycmJwADJjU0NxIBNjc3MxYVFAcGAhEQExIXFgK9Bh8EHjn+yi8HBy8BNjkeBB8GC8O9QFzkC/xUAwYEGD0BVQI8UHZ0UgI7AVU9GAQGAwQMyv2+/nX+w/8A/pTtDAAAAQAi/EsCDgWqABsABrMUBAEwKyUQATQ2MzMXFhcAExYVFAcCAQYHByMiJjU2NwABrP52CA4PBB45ATYvBwcv/so5HgQPDwcvOwEg+wMZAYoIBAQYPf6r/cVSdHVR/cT+qz0YBAQIL00BgAAAAQA3/EsD3AWqABUABrMJAAEwKxMiJjU0NzYANzYzMhYHBgMGAAcABwZRCw8BAwNuAgUQDBEBBo8f/sFb/t0EB/xLEgoEAgkJJQMMEgsS/oFS/Kzx/PUECwAAAQD3/EsCBAWqAAcABrMBAAEwKxMRIRUjETMV9wENz8/8SwlfPvcdPgAAAQA4/EsD3AWqABcABrMOAgEwKwEUBiMiJyYBJgAnAjU0NjMWFxYBFgAXEgPcEAoPBwT+3Vv+wR+UEAwNBgQBI1sBPx+V/GYLEAsEAwvxA1RSAYwIDA4CCQT89fH8rFL+cQABAAv8SwEYBaoABwAGswMBATArEzUhESE1MxELAQ3+888FbD72oT4I4wABAIL8SwJqBaoATwAGsyEBATArAQcjJyYmJyYmAwInJiYnJicmNDY2NzY3Njc2ExI2NzY3NzMXFRQHFAcGBwYHBgYDAgYHBgYHDgIHBxcWFhcWFhMUFRYXFhUWFxYXFhUWFQJqBh4OYHoSBQEBAQEMYkUMAQECBAg/MTYNAQEBAQUlxRAeBgIKJBpfFAQBAQEBBQ9lTwMMBwIJEVVuEAUBAQEEARRfGiQKAvxRBgYofUsVOwERAUIKToElBwQDFAgDBCE7RVMKAUIBETwVmVUHBg8QAgIEEhRJXhQ4/u/+8DwVRXgqAgYEAQMJKn1IFTz+8TBLzREDAl5JFBIEAgIQAAABAIP8SwJqBaoARwAGsyYCATArEjQ2OwIXFhYXFhYTExcWFxYXFhYVFAYGBwYHBgcHAwIGBwYGBwcjIiY9AjQ2NzY3Njc2Ejc2NzY3Njc3JyYnJgInJicmJ4MFDAUOD155EgYBAQECEWglGAcDAQQFOipDDwIBAQEGEnleDw4QBgQHBAKWGQECAQ00FyUpMBQUuxsBAgEZlg4CBYYeBgYoe0oXPf7w/sAOdlYcCwQGDQoHBAMdL0ldDv6//vA9F0p7KAYECgcGCQYDAQFSjBECdBBPQR0eIBkJCmGjEQJzEYxSBgQAAAH//AI0BacDBAATAAazCgQBMCsDBiQ3NwUEMxQHByIkIyIFBCMnJgQKAWq6ugFrAWsBBAQF/TwEA/6b/p0DBAQCWwNVKyxUVQETE4ZDQxMTAAABAAECYgWiAu0AJQAGswcAATArEyc0Njc2NzYzMhcWFxYXFjMyNzYzFxQHBgcGIicmJyYnJiMiBwYLCmIUh3IzOTsMTX9aOi03o/YVAwp1qo8MWgxNgVo5Ljej9hUCYiEDIAUrDwgBCCUaCAdQByEFIzUMAQEHJhoIB1AHAAAB+lgCNAADAwQAEwAGswoEATArAQYkNzcFBDMUBwciJCMiBQQjJyb6WAoBarq6AWsBawEEBAT9OwQD/pv+nQMEBAJbA1UrLFRVARMThkNDExMAAfpdAmL//gLtACUABrMHAAEwKwEnNDY3Njc2MzIXFhcWFxYzMjc2MxcUBwYHBiInJicmJyYjIgcG+mcKYhSHcjM5OwxNf1o6LTej9hUDCnWqjwxaDE2BWjkuN6P2FQJiIQMgBSsPCAEIJRoIB1AHIQUjNQwBAQcmGggHUAcAAQBv/EoD/AWqAB0ABrMbEwEwKwEmAic0BwYGBwcmJyc3NxM0ADc2MzIWFxQABwYjIgGoAtsBIAcRBAUGBw1MTdEB/AIGDAYMAf3UBAMVDPxMAQQCAQM0CxwGBwUIDXp5/DgDCGgFCgoHCPbGBAkAAAEA9vxLAjsFqgAFAAazAQABMCsTESEVIRH2AUX++fxLCV8+9t8AAQAL/EsBUAWqAAUABrMDAQEwKxM1IREjEQsBRT4FbD72oQkhAAABAPb8SwI7BaoABQAGswEAATArExEzESEV9j4BB/xLCV/23z4AAAEAC/xLAVAFqgAFAAazAwEBMCsBETMRITUBEj7+u/yJCSH2oT4AAQB+/EoCjgWqABYABrMSBQEwKzc1ExI3NjMyFhUVAwIUExMVFAYiJyYDfuvqAgsQDRHo6OjoEhgPAuryEQJKAkoEDxINCP28/b4G/b79vQkOEQ8EAkoAAAEAXvxLAm8FqgAXAAazDAABMCsTIjU1ExI0AwI1NDc2MzIXFhMTFQMCBwZ9Hujo6OkBCRQRCwLq6+vrAQj8Sx4JAkMCQgYCQgJEDQICFg8E/bb9thH9tf20AQ8AAgAAAAABLABkAAMABwAItQUEAQACMCsxNTMVMzUzFWRkZGRkZGQAAAIAAAAAASwAZAADAAcACLUFBAEAAjArMTUzFTM1MxVkZGRkZGRkAAABAAAAAABkAGQAAwAGswEAATArMTUzFWRkZAAAAAABAAAAGwBQAAIAAAAAAAIAAAAQAHcAAAAaC5cAAAAAAAAAFgAWABYAFgBRAIcAtADJAPoBDwGQAgMCAwIsAmsClALTAwsDHgMxA0QDVwODA7EDxQPZA+cAAQAAAAEAAHeIEf1fDzz1AAsD6AAAAADYspkKAAAAANiymQr6WPxKBacFqgAAAAgAAgAAAAAAAAD6ADIAAAAAAU0AAAD6AAAC4ADRAuAAIgQUADcCEAD3BBQAOAIQAAsC7gCCAu4AgwD6AAAFpP/8BaQAAQAA+lgAAPpdA+gAbwJHAPYCRwALAkcA9gJHAAsC7gB+Au4AXgEsAAABLAAAAGQAAAABAAAFqvxKAFoFpPpY/+wFpwABAAAAAAAAAAAAAAAAAAAAGwACAqsBkAAFAAACigK8AAAAjAKKArwAAAHgADEBAgAAAAAAAAAAAAAAAIAAAO8QAOztAAAAAAAAAABQZkVkAEAAIO//AyD/OABaBaoDtiAAAI9eAwAAAAAAAAAAACAAAQAAAAMAAAADAAAAHAABAAAAAACkAAMAAQAAABwABACIAAAAHgAQAAMADgAgACkALwBdAHsAfQCgAsYC3AMDIhojCyfp7////wAAACAAKAAvAFsAewB9AKACxgLcAwIiGiMIJ+jv/f///+P/3P/X/6z/j/+O/2z9R/0y/Q3d990K2C4QGwABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAABBgAAAQAAAAAAAAABAgAAAAIAAAAAAAAAAAAAAAAAAAABAAADAAAAAAAAAAQFAAAAAAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAcICQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACgALAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAEQAAAAAAAAwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADQ4AAAAAAAAAAAAAsAAsILAAVVhFWSAgS7gADlFLsAZTWliwNBuwKFlgZiCKVViwAiVhuQgACABjYyNiGyEhsABZsABDI0SyAAEAQ2BCLbABLLAgYGYtsAIsIGQgsMBQsAQmWrIoAQpDRWNFUltYISMhG4pYILBQUFghsEBZGyCwOFBYIbA4WVkgsQEKQ0VjRWFksChQWCGxAQpDRWNFILAwUFghsDBZGyCwwFBYIGYgiophILAKUFhgGyCwIFBYIbAKYBsgsDZQWCGwNmAbYFlZWRuwAStZWSOwAFBYZVlZLbADLCBFILAEJWFkILAFQ1BYsAUjQrAGI0IbISFZsAFgLbAELCMhIyEgZLEFYkIgsAYjQrEBCkNFY7EBCkOwAGBFY7ADKiEgsAZDIIogirABK7EwBSWwBCZRWGBQG2FSWVgjWSEgsEBTWLABKxshsEBZI7AAUFhlWS2wBSywB0MrsgACAENgQi2wBiywByNCIyCwACNCYbACYmawAWOwAWCwBSotsAcsICBFILALQ2O4BABiILAAUFiwQGBZZrABY2BEsAFgLbAILLIHCwBDRUIqIbIAAQBDYEItsAkssABDI0SyAAEAQ2BCLbAKLCAgRSCwASsjsABDsAQlYCBFiiNhIGQgsCBQWCGwABuwMFBYsCAbsEBZWSOwAFBYZVmwAyUjYUREsAFgLbALLCAgRSCwASsjsABDsAQlYCBFiiNhIGSwJFBYsAAbsEBZI7AAUFhlWbADJSNhRESwAWAtsAwsILAAI0KyCwoDRVghGyMhWSohLbANLLECAkWwZGFELbAOLLABYCAgsAxDSrAAUFggsAwjQlmwDUNKsABSWCCwDSNCWS2wDywgsBBiZrABYyC4BABjiiNhsA5DYCCKYCCwDiNCIy2wECxLVFixBGREWSSwDWUjeC2wESxLUVhLU1ixBGREWRshWSSwE2UjeC2wEiyxAA9DVVixDw9DsAFhQrAPK1mwAEOwAiVCsQwCJUKxDQIlQrABFiMgsAMlUFixAQBDYLAEJUKKiiCKI2GwDiohI7ABYSCKI2GwDiohG7EBAENgsAIlQrACJWGwDiohWbAMQ0ewDUNHYLACYiCwAFBYsEBgWWawAWMgsAtDY7gEAGIgsABQWLBAYFlmsAFjYLEAABMjRLABQ7AAPrIBAQFDYEItsBMsALEAAkVUWLAPI0IgRbALI0KwCiOwAGBCIGCwAWG1EBABAA4AQkKKYLESBiuwdSsbIlktsBQssQATKy2wFSyxARMrLbAWLLECEystsBcssQMTKy2wGCyxBBMrLbAZLLEFEystsBossQYTKy2wGyyxBxMrLbAcLLEIEystsB0ssQkTKy2wKSwgLrABXS2wKiwgLrABcS2wKywgLrABci2wHiwAsA0rsQACRVRYsA8jQiBFsAsjQrAKI7AAYEIgYLABYbUQEAEADgBCQopgsRIGK7B1KxsiWS2wHyyxAB4rLbAgLLEBHistsCEssQIeKy2wIiyxAx4rLbAjLLEEHistsCQssQUeKy2wJSyxBh4rLbAmLLEHHistsCcssQgeKy2wKCyxCR4rLbAsLCA8sAFgLbAtLCBgsBBgIEMjsAFgQ7ACJWGwAWCwLCohLbAuLLAtK7AtKi2wLywgIEcgILALQ2O4BABiILAAUFiwQGBZZrABY2AjYTgjIIpVWCBHICCwC0NjuAQAYiCwAFBYsEBgWWawAWNgI2E4GyFZLbAwLACxAAJFVFiwARawLyqxBQEVRVgwWRsiWS2wMSwAsA0rsQACRVRYsAEWsC8qsQUBFUVYMFkbIlktsDIsIDWwAWAtsDMsALABRWO4BABiILAAUFiwQGBZZrABY7ABK7ALQ2O4BABiILAAUFiwQGBZZrABY7ABK7AAFrQAAAAAAEQ+IzixMgEVKi2wNCwgPCBHILALQ2O4BABiILAAUFiwQGBZZrABY2CwAENhOC2wNSwuFzwtsDYsIDwgRyCwC0NjuAQAYiCwAFBYsEBgWWawAWNgsABDYbABQ2M4LbA3LLECABYlIC4gR7AAI0KwAiVJiopHI0cjYSBYYhshWbABI0KyNgEBFRQqLbA4LLAAFrAEJbAEJUcjRyNhsAlDK2WKLiMgIDyKOC2wOSywABawBCWwBCUgLkcjRyNhILAEI0KwCUMrILBgUFggsEBRWLMCIAMgG7MCJgMaWUJCIyCwCEMgiiNHI0cjYSNGYLAEQ7ACYiCwAFBYsEBgWWawAWNgILABKyCKimEgsAJDYGQjsANDYWRQWLACQ2EbsANDYFmwAyWwAmIgsABQWLBAYFlmsAFjYSMgILAEJiNGYTgbI7AIQ0awAiWwCENHI0cjYWAgsARDsAJiILAAUFiwQGBZZrABY2AjILABKyOwBENgsAErsAUlYbAFJbACYiCwAFBYsEBgWWawAWOwBCZhILAEJWBkI7ADJWBkUFghGyMhWSMgILAEJiNGYThZLbA6LLAAFiAgILAFJiAuRyNHI2EjPDgtsDsssAAWILAII0IgICBGI0ewASsjYTgtsDwssAAWsAMlsAIlRyNHI2GwAFRYLiA8IyEbsAIlsAIlRyNHI2EgsAUlsAQlRyNHI2GwBiWwBSVJsAIlYbkIAAgAY2MjIFhiGyFZY7gEAGIgsABQWLBAYFlmsAFjYCMuIyAgPIo4IyFZLbA9LLAAFiCwCEMgLkcjRyNhIGCwIGBmsAJiILAAUFiwQGBZZrABYyMgIDyKOC2wPiwjIC5GsAIlRlJYIDxZLrEuARQrLbA/LCMgLkawAiVGUFggPFkusS4BFCstsEAsIyAuRrACJUZSWCA8WSMgLkawAiVGUFggPFkusS4BFCstsEEssDgrIyAuRrACJUZSWCA8WS6xLgEUKy2wQiywOSuKICA8sAQjQoo4IyAuRrACJUZSWCA8WS6xLgEUK7AEQy6wListsEMssAAWsAQlsAQmIC5HI0cjYbAJQysjIDwgLiM4sS4BFCstsEQssQgEJUKwABawBCWwBCUgLkcjRyNhILAEI0KwCUMrILBgUFggsEBRWLMCIAMgG7MCJgMaWUJCIyBHsARDsAJiILAAUFiwQGBZZrABY2AgsAErIIqKYSCwAkNgZCOwA0NhZFBYsAJDYRuwA0NgWbADJbACYiCwAFBYsEBgWWawAWNhsAIlRmE4IyA8IzgbISAgRiNHsAErI2E4IVmxLgEUKy2wRSywOCsusS4BFCstsEYssDkrISMgIDywBCNCIzixLgEUK7AEQy6wListsEcssAAVIEewACNCsgABARUUEy6wNCotsEgssAAVIEewACNCsgABARUUEy6wNCotsEkssQABFBOwNSotsEossDcqLbBLLLAAFkUjIC4gRoojYTixLgEUKy2wTCywCCNCsEsrLbBNLLIAAEQrLbBOLLIAAUQrLbBPLLIBAEQrLbBQLLIBAUQrLbBRLLIAAEUrLbBSLLIAAUUrLbBTLLIBAEUrLbBULLIBAUUrLbBVLLIAAEErLbBWLLIAAUErLbBXLLIBAEErLbBYLLIBAUErLbBZLLIAAEMrLbBaLLIAAUMrLbBbLLIBAEMrLbBcLLIBAUMrLbBdLLIAAEYrLbBeLLIAAUYrLbBfLLIBAEYrLbBgLLIBAUYrLbBhLLIAAEIrLbBiLLIAAUIrLbBjLLIBAEIrLbBkLLIBAUIrLbBlLLA6Ky6xLgEUKy2wZiywOiuwPistsGcssDorsD8rLbBoLLAAFrA6K7BAKy2waSywOysusS4BFCstsGossDsrsD4rLbBrLLA7K7A/Ky2wbCywOyuwQCstsG0ssDwrLrEuARQrLbBuLLA8K7A+Ky2wbyywPCuwPystsHAssDwrsEArLbBxLLA9Ky6xLgEUKy2wciywPSuwPistsHMssD0rsD8rLbB0LLA9K7BAKy2wdSyzCQQCA0VYIRsjIVlCK7AIZbADJFB4sQUBFUVYMFktAABLuADIUlixAQGOWbABuQgACABjcLEABkKxAAAqsQAGQrEACCqxAAZCsQAIKrEABkK5AAAACSqxAAZCuQAAAAkqsQMARLEkAYhRWLBAiFixA2REsSYBiFFYugiAAAEEQIhjVFixAwBEWVlZWbEADCq4Af+FsASNsQIARLEFZEQAAAAAAAAAAAAAAAAAAAAAFgEOAAEAAAAAAAAAUQAAAAEAAAAAAAEACwBRAAEAAAAAAAIABwBcAAEAAAAAAAMAIwBjAAEAAAAAAAQAEwCGAAEAAAAAAAUADQCZAAEAAAAAAAYAEwCGAAEAAAAAAA0BMwCmAAEAAAAAAA4AGgHZAAEAAAAAABAACwBRAAEAAAAAABEABwBcAAMAAQQJAAAAogHzAAMAAQQJAAEAFgKVAAMAAQQJAAIADgKrAAMAAQQJAAMARgK5AAMAAQQJAAQAJgL/AAMAAQQJAAUAGgMlAAMAAQQJAAYAJgL/AAMAAQQJAA0CZgM/AAMAAQQJAA4ANAWlAAMAAQQJABAAFgKVAAMAAQQJABEADgKrQ29weXJpZ2h0IChjKSAyMDA5LTIwMTAgRGVzaWduIFNjaWVuY2UsIEluYy4KQ29weXJpZ2h0IChjKSAyMDE0LTIwMTggS2hhbiBBY2FkZW15S2FUZVhfU2l6ZTNSZWd1bGFyRm9udEZvcmdlIDIuMCA6IEthVGVYX1NpemUzLVJlZ3VsYXJLYVRlWF9TaXplMy1SZWd1bGFyVmVyc2lvbiAwLjAuNENvcHlyaWdodCAoYykgMjAwOS0yMDEwLCBEZXNpZ24gU2NpZW5jZSwgSW5jLiAoPHd3dy5tYXRoamF4Lm9yZz4pCkNvcHlyaWdodCAoYykgMjAxNC0yMDE4IEtoYW4gQWNhZGVteSAoPHd3dy5raGFuYWNhZGVteS5vcmc+KSwKd2l0aCBSZXNlcnZlZCBGb250IE5hbWUgS2FUZVhfU2l6ZTMuCgpUaGlzIEZvbnQgU29mdHdhcmUgaXMgbGljZW5zZWQgdW5kZXIgdGhlIFNJTCBPcGVuIEZvbnQgTGljZW5zZSwgVmVyc2lvbiAxLjEuClRoaXMgbGljZW5zZSBhdmFpbGFibGUgd2l0aCBhIEZBUSBhdDoKaHR0cDovL3NjcmlwdHMuc2lsLm9yZy9PRkxodHRwOi8vc2NyaXB0cy5zaWwub3JnL09GTABDAG8AcAB5AHIAaQBnAGgAdAAgACgAYwApACAAMgAwADAAOQAtADIAMAAxADAAIABEAGUAcwBpAGcAbgAgAFMAYwBpAGUAbgBjAGUALAAgAEkAbgBjAC4ACgBDAG8AcAB5AHIAaQBnAGgAdAAgACgAYwApACAAMgAwADEANAAtADIAMAAxADgAIABLAGgAYQBuACAAQQBjAGEAZABlAG0AeQBLAGEAVABlAFgAXwBTAGkAegBlADMAUgBlAGcAdQBsAGEAcgBGAG8AbgB0AEYAbwByAGcAZQAgADIALgAwACAAOgAgAEsAYQBUAGUAWABfAFMAaQB6AGUAMwAtAFIAZQBnAHUAbABhAHIASwBhAFQAZQBYAF8AUwBpAHoAZQAzAC0AUgBlAGcAdQBsAGEAcgBWAGUAcgBzAGkAbwBuACAAMAAuADAALgA0AEMAbwBwAHkAcgBpAGcAaAB0ACAAKABjACkAIAAyADAAMAA5AC0AMgAwADEAMAAsACAARABlAHMAaQBnAG4AIABTAGMAaQBlAG4AYwBlACwAIABJAG4AYwAuACAAKAA8AHcAdwB3AC4AbQBhAHQAaABqAGEAeAAuAG8AcgBnAD4AKQAKAEMAbwBwAHkAcgBpAGcAaAB0ACAAKABjACkAIAAyADAAMQA0AC0AMgAwADEAOAAgAEsAaABhAG4AIABBAGMAYQBkAGUAbQB5ACAAKAA8AHcAdwB3AC4AawBoAGEAbgBhAGMAYQBkAGUAbQB5AC4AbwByAGcAPgApACwACgB3AGkAdABoACAAUgBlAHMAZQByAHYAZQBkACAARgBvAG4AdAAgAE4AYQBtAGUAIABLAGEAVABlAFgAXwBTAGkAegBlADMALgAKAAoAVABoAGkAcwAgAEYAbwBuAHQAIABTAG8AZgB0AHcAYQByAGUAIABpAHMAIABsAGkAYwBlAG4AcwBlAGQAIAB1AG4AZABlAHIAIAB0AGgAZQAgAFMASQBMACAATwBwAGUAbgAgAEYAbwBuAHQAIABMAGkAYwBlAG4AcwBlACwAIABWAGUAcgBzAGkAbwBuACAAMQAuADEALgAKAFQAaABpAHMAIABsAGkAYwBlAG4AcwBlACAAYQB2AGEAaQBsAGEAYgBsAGUAIAB3AGkAdABoACAAYQAgAEYAQQBRACAAYQB0ADoACgBoAHQAdABwADoALwAvAHMAYwByAGkAcAB0AHMALgBzAGkAbAAuAG8AcgBnAC8ATwBGAEwAaAB0AHQAcAA6AC8ALwBzAGMAcgBpAHAAdABzAC4AcwBpAGwALgBvAHIAZwAvAE8ARgBMAAACAAAAAAAA/4MAMgAAAAAAAAAAAAAAAAAAAAAAAAAAABsAAAABAAIAAwALAAwAEgA+AD8AQABeAGABAgDYANkBAwEEAKUBBQEGAQcBCAEJAQoBCwEMAQ0HdW5pMDBBMAd1bmkwMzAyCXRpbGRlY29tYgd1bmkyMzA4B3VuaTIzMDkHdW5pMjMwQQd1bmkyMzBCB3VuaTI3RTgHdW5pMjdFOQd1bmlFRkZEB3VuaUVGRkUHdW5pRUZGRgAAAAEAAf//AA8=) format("truetype")}@font-face{font-family:KaTeX_Size4;font-style:normal;font-weight:400;src:url(data:font/woff2;base64,d09GMgABAAAAABOkAA4AAAAAK0AAABNOAAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAABmAAg0oIDAmXFxEICqMImjABNgIkA4FYC24ABCAFjWcHg0gMfxuEJbMRNmwcgDjwu2D+6wRuyIS/gdU5iWtyulgw1Wzdm4nbqVapRINEcSR3Ou/GgoE733BULv21sA8bIcnsEW7WzCZZEoIEOCqalqtTDopWhZYqUHGs4qf6ZtZ7NT/Twv+jrZ8VJXiQGx5iWcS+DJY1VBI0s1bUFPV01cngVUcFD/Q73zdmcjIxSRp1R6mQuqY2Q3PpXct3/8NACcBVDgNl1BRz2TixNGB2CIESq80X+h8AtjD81++n/yVcVoQ7+wJ7jMqdeqSP4xsj61wH5+VF+WCE4xjTj+CUkas6+T+bZvtndscw1e1Rkg430HEPABVQ03x9afbt7EhsWEsBSSGSbNb5SNLLkxTGkqGSHUAumqtC2LmpU1RpihTl2ZClJQ/Ezlpd+I5tG84u1F66ORIjod0Lr+8CCMPhhcABkLPJ0wBw7vHB8XuwBQLHHe8A+E+Cv/+Bz9Ox10ehivwvMVraAv3Zp+yPMsAFwwych2S7FhpMStIBeNng4rBw55eZTcYCBVmeFYZsttWN5FXyNcNkJplE032mx3L++B5/CPy31AFGZLnAnQ4w4vCma6p//x5+6PjvxPyX4Cdf+8y9LnC+mRONJ4pOqL85NKP8evPXDeT630oXj/2XXGvrEJCACoyapRMBQK/eOZaD64jC+UgreAGOcSVsgtStHUGggkNTa+BHughmAcE0ztLjP6DpfAx9+JBwnJD7Vlbqgq8Qb//yxQSauc2c90AfUGujHhBUYgBBLlcBghbi+Rew+UOfm1DteD5+9TF5867rvaTjNnmq3pzwRM/zvGVVrFK7IDemkgjg1sCKCs9XaKXu7NYGpS6hQC4MlFHuAle65LvowLhCA4L+0vjaAwwaC9bbheD0IsFZhFp03mewDLCYN69F5eqooph0uguB0aMEs/SJr0Xq5L/F9ajWYSJsfpnKC9e+ysmyF1UPCQxXKyUax2wOFLrQA7ENUF/RiiZA3k4LqVdgA5Zwy4ACaVkjav6HLWqxKFNVZpxcGYUX4ukVm6BxPO+tDcLa1o8r2bw2hgG1sF407kyVFqbKQrI5L0Q+ocpAyKe5tSMZl0Skz7C8jEHDEVRUo6+pFzeY+uSd+XzeB9RU0qsnWo0CGsBSQqVHQ8RCfD6jTrIupsbPuVqEZJNvXX/YoulMFRoVdaOXaCxaQOLxm1TZdpRPou7sW0DH45fp8evcjPOHZdiqngra2re+VtWAVUQbuUbnEI9V9cLU08B9E4yfQbVeGjZW6M6W3JGltzovEXcIQCJbdK3MqDRFTZFwHV8148FXrAAGG4ECKnpM+LoOGFirQOrfJLQWNUa0iNKA0agCVj+lvXWwA6vYjf7rR+msDXciB5ZRwXAhYKRiBOI4gXjOQAJnIZFzkMQpJHMFpHAeUrlQmYcG4Ne08uHXKoD14zqNNdShJEtnaUymABmcQCZnwMRZWM45yOIUsrkCcjgPuVzwzQQNlFBYXZBKDc03Q39gz2JucAvGAoVB4TKwAmkqV5St3bL9WPMoofP5J2X1zzPjPiuWlUvGcbqca2hspmmu/NQidENhbQdeDd5IKYAhvWFBGeJ+wHnh1N2xrVqU6PMBB2o0VTgEauUfFHAyONAEXLh4YSqCn+6mkmL/lAacB0xN+xt62J09tam1SjPnM2ixdyVo3Hs+4AGIg3VYx+mOoAvLzmJS03nyOyke0IBJGdYiWl6MbvDTq+7Sd3K5GePUK+TNsByjCV7qTOihTYrclCDq0o4otrfvQlQWBqN2IREv07oRlJ1QXaK31JoEm23SbjmD1wTiOirmaovGwEBbShejBOftVhcrD5urZFyLPi+x3dwawvx8QUkfxOEc5LIRQmu24lbpNuAtSpqQNHJXUFYQrYEy6QtBIA3UmHeQ3BsIzuYZ6m7bw4ffmKcaNmHlmsDacVB+InN7K543KZeryfNlWIEByWxdJ6+SmjyolkRdiPdW7uxFhyr0xkj3XA2e4FpbA8XRyZdNa7m6zhOqYDXAgk3VNjGRqXWFpsYdtC1+xToqD7msY1v8X0ybH+lPO5g7N7blvMMHfVYyqLeGZwDeMOhtwpo6dWaNcePWme1hQ/T3JPocy93SFHqpPnIG5yg1g1tDy/NB3Ng00KQzVYbK+miPGVrsqlZ6KoA6Zm0coV0isA6O0OkA1LMujuCXCCzAEYIOQDXr5gg9EoH1coQ+B6CW9XOEAYnABjnCkAPQwIY5wohEYKMcIeQA1LAwR4hIBBbleGbMvFhi52AslVmsWNY4q4SJLMQBq4LJVCk6TNmlMG2XmplAR5jtLYM5uwzm7TJYsMtgZW85rLLLYbVdDmvs8klrzQ8JLHnrya85J/OxRWZ5x4YHlXkKAQGXgBbO0qVvxrM4AfsoAJ2G8w4SABYBgU44rS8AeGGkO7LsahqRRgcxvLg/tPTJRAb0dERSDD9OgF/AnAnOKCa2MDE8lEWeRC7Sb/gRYH/sJ2AGrROCFMaoWg082nM73cRYJyFW7bjfoboJXpIxVmm9cmW98w2FNIQUKKe7DVP+h+snhVuSqd4ERAPaGqUh5RaUTWhujkpeQKMYJPk27eh1muiA3BDxJjYYmZGgetSDWBqlUNKnwlNt+NYzp8Ici86LZCj7ZkPqyrqueDo8vOEgeznafFOvy5MxDQj1ycp5wGk+ByiLa5XfS29m2rzu+rTy7zrTEnUAJNnEd5j4RGloxslQ3WfCDrUhRV3VSQs1RavDEZ6wauv7ToRU/uISkGLAkuns12pXNH0PsqrmdvXP8i+73qVpljvIzP9FDSxhdZ1WAQk5g5T29tZ5pISdgjJrSs+xWmjzNv8Uq8Vuh4t1nT4JCEVKNIuzkFLjCI5T8wwpBVbrJ2QYzCVWLjdd0R1juaeMpUc3q5ERbYgncMwvTDbLD0Ii0kRRb5rxSNYzavk02qzLeKMXxm4elHRAqPHpWosCje5lGeMUdMXNw2RN3KZcUbJQyhAeZLnjxO28s8CHjDaXSma12amXT6fIyZF1Pj8xw+vDeHqlya4jJ5gGhjqP2qzwKMsYgmdvUqDM3s935xpcKI/PcBJY3NqqUVqf+ud6OezXN5vgiqgMWhkd9axPFm7o0ZLQBK0gs674U2Qlnig5QBqOT9lk5Yh/+gWENNSQmRSUb1REBKc2S08dpRDTRJW2xMC3KyGSoqkensNnKCYkqQ0zl0gZ4zBOlCMc11AlQ0+gyjqhiO5xDX8NrcFNGeI7degfbbaG3UZQ+6eXhpw3R7UxjVBR2NzMFdcwojhR1+Q/MpZEODKH91WnRr8JwMhME7VBzh9mNI8qtyB0N8UxuLF2CdWbmsDgNHXi/yvr20CZ9htelV6dUB4/LVbgGKhZVr2uTkDcS7qHN0I0sxSHMq44h7d5GugXMo929eCDF7L1rOmKJ0PvlnLqPWUovEoCZJge9DkWd6XEwow6vpJ1xdfZp8NNlD+KoBdAiAGGeP0S82iD7sjNe5gXlB21A/htO8A49Ojf29eP/nt352VKOl2QfvjYL6OeVWtzcjckdFagJO4dwcCr8UJQbJhvYraLjnJUp2TYO94fjDvljGbvhgY675GlTb++eU2SrEIGaX3BVsM5kkonTm+fSh//AOJjDu9fIGb95aXM6Y+rUGWYNhRGQOeJOpV0TpiKFLpvrwP9S6V5ga+CGQmby+rHrV7VQPL5cGF64Wa9r397VZ7Oj5ks5ViO05MMnV0KYRhTX+7mQgkuPC959HDe7FQb/3t/RlCnEi5RdvWt/pZr5E89hVdu75tqbm/LvmXr6h9MdCnz+yOs9/ZfKESuu0RQUYE+J2ULolT8yOCOEflMf17yeeDnHdTdoUsbzbooxnESZ8RARqM5dKm62wdeXU9ynj9hqjcQa84q1uqDOnW23zzdH1aeyp9yKs9v6p7whpp/VeSHvA0bSfx+0PDk9W2WiJG++/1H0ypSCp+GqZI4OwTy8eCHIx+PfDKIwpyJcgg0a5/TFt/0uVeczN9e1MH787L3Pa6PC1QZWGgw13MgZB5+1Fkvfem+rCzBK47nN6cEE4z2/NyHcHMnBvaxkgvu8ihthx9fD3F1Hu3L/EHk3qqUMlPR32HaD42/722+25/l/HeYeslL6V+eQ5rViruoIvOrSzNzjSpCtH0tj+06RJb8f7LlSt/lMD5He1vKohmvycw1BTajvR4VqbXK5KX6U69k48X9OVJHYFeQYa97U37xP80Rck2GnGyVCmqlarSTf5d9yjEJp30+sR702bU8SslqlyyTxE33WYhdqhONzyOLY/1nUseDm5mgzgDrz+knht5L38+47WiT6goka7K8X/og7YqX1t6z7zqK+9eLOlGDt/G76QcZ15JqqXaB7pM+Sl59e+OFf/50NIHWCJvmPiVRYPqO/vRN395U8jSl9w+k1Uget8IvTitOBYViIKAA+hCt7A/0R9gpOsC4l6klMLBSIVdk6IrTBCjK1HzKKXX5eoOLzxG9XRtFUgoXsGJx1l5k9uQ7JJkk/vAPLz556QVptVmv0oTAGVJVXvbH/OYPXnntyLaKrj735/41O9vrdjkjdJ7/Y1HJojSBsk58/aeopY+d+TiBTOTx3prxd+g28c+fCDX/tDVouu0af8tV+UFuUHg8Fe2yI38Pg3tgv6ioWrIaW4KRIBiyUx3SRlsFzWnrFFa2FH/nVyFV7tsl6XS3ndbUtr1sno7z/zwksijxOOhe2Deob1VuUiHzwNpklcYLjyQgPZVnQsb4PtG5svHWHac33SYZggYdBJdWR/QOTQSxDM6jYknWHgO1RMYh2HSFqCrZn9D66Zkf7QrcFRh/23e175pw/vrJLy7dC3uuFVTb6Dl79Ae+OTir3/IRLpD3iyQh7bT7935+wOalTGnZoj5Vovyt3zszhI69y/xvdO7NVwmSSbvshRxW4sG+rV2k36qTZovAxrJ7mD7jK32o59ekXyuds+Evm+o+Dpq2tpy6vSlWvoVnJFZnxAk0Svoda+gTXZ5G4y3OkJZek5bC2cTT1zbiEPvOtpqCOm3I+dumQN3m+K9LJCPS+Ia8M17dQ/iF2IzR9gyb9m8jOol+5BOU3ra/D/Zo13d34WPKNUP8jj2vOolOT5Ubbt1AIXpu52PnUCA7ANDYBmlUDDHuwzf1LR2f9xHKIhBrwUMagjNHS5QIUk0kg5ZVWohUIk/1EjFiwSiyOsFSX1FL7iyMieeQQGiakWWUKdiqBkvbmpqQ8Zw08FIEyYEUiCVIFSsN2MILzj7CGceLeNm4SYD3tbvEah/Rlh3gReZ3AIDPH7xKGV718EXH0hRz9FMA4IEAkGAAw0Xoz0PpvqXf639GaVOXo1DUj61wtMQkwD/b7IzkJHiiRlRHRgHHZMOFQEhFRWhpL20NCMDhi7Z5E/M7zEfbUT0E3HAHZhpNkIF04m/cIboGKyEDQFxRZDbiDsrC3eAlPJjByjAfZ8O5fdPxRCbPboQvLv2eOgj6QnLMAA5A1GD1Ej2moDtHst5Jqq+gp1PigsYg0KkSLoIInS4BBQy6DJhEXBYMTnc5UMNVrbTAVaMdbnc1kBS+aJUEWDqfkX5WOOlm3JdwEeKiy1wCGnKPy0BD9ITLQna05HKQFGe10sFVkzGm0tWAI72tVRq4bo3/tEA2kveVitQfIG7t7K4+7Rz7i3rqYkubY4JHbpkIzX3fwlEtoUCsd+S7PyQcP2mGvscFbuGq8VjJnS1WuURGSRROjfJUV7S01fJcEoeaF2+eEBSUfbae+gbkp0Ib+j5c+4o83RWlno7FQ2OMOmtW9mrxOqdTjagb4JqKq7/Ze2Bydan3t7V5vZjW+Px+3u/1fafrKLb6LZe8OqdtlifGTRGn5N+I1Q+tidWdcmhNibK7kvoDDvBrZjoe3ML2Bl/RNwS15i3YaJVJ4yasIcsVkUdWxMqqWGFU22SsrE7MamQ9x8yPjcV0RGlzyHjDrbNQst7AxsE8ugVkQmxZ9UhIVGbO2qhFSMDZZq8RfpM2VXHoEmuvtNaMkFUazJuzJqJXJUxMiLGofEtKyEw6FC4XBZruds0qI1jzBSvLzWXpMOZlZV6IUaHM+strW8wKWWPClJANLJVeTyrkmb2eyMQ0WltoXlu0NgtCzaRiRjaZWW0ovU6dEiW7aKuyNiGzzbmFGo9WJvREqH01qfabbEyvP9mqhIyiZwwTMRxbDdF+a01UASOrZGLktV4+snYLyGuzbvexAHN9N4ONbpRqDQWfLQtZR2ayoThhM62yUUxIZKFaZ+LcNUooHYRdLzS94imsFnGcXmB0jEV8asbMj/8V2jXwEeUInE9w6WBFkq7+dT8pEEEFehUqVRk2Ggh8Dl8ggyzchhxSVDxIKm2s43o+CMEIiuEESdEMy6nUGq1ObzCazPHPTVqt3hp5avuygW9yJhr7nSApC4oSD4hXeDv0vCKKJLJd8F8oEDZRJOzCIZzCJdzCI4pFtagRtXZdPBBKdyaIQrreeqtgrctszkWsYhO7dSxraADWifpXa4CWD17v6t2NeH7fIn7mbPa1G2jNboB82Dl/lycAQFi6M1D3LsczO3sXq87sdSHKsyue5HcAsrF8JNCLo6d77t2gyn8cl3b2vN2kLM9F6wAA) format("woff2"),url(data:font/woff;base64,d09GRgABAAAAABgoAA4AAAAAKwgAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABPUy8yAAANiAAAAE4AAABgRuZdBmNtYXAAAA3YAAAAugAAAcoB+528Y3Z0IAAAFIgAAAAKAAAADAAAAABmcGdtAAAOlAAABYwAAAuX1RTb8Gdhc3AAABggAAAACAAAAAgAAAAQZ2x5ZgAAAUQAAArKAAARUELbjX5oZWFkAAAMoAAAADYAAAA2EIN07WhoZWEAAA1oAAAAHwAAACQHMgKeaG10eAAADNgAAACPAAAA2JZiEF1sb2NhAAAMMAAAAG4AAABueip1+m1heHAAAAwQAAAAHwAAACAAygwAbmFtZQAAFJQAAALAAAAG507M7Lhwb3N0AAAXVAAAAMoAAAHIC8Bi1nByZXAAABQgAAAAaAAAAH/i0Eg6eNqtWAV4G9fS3Zm7e1crraQFyUySbCu1QxaGoRhDmL7Gf5lCZW6dr244KTMzM7eBnx5zmZmZG7a1eXN3peDj9/Zq0aNzZs7Mzr2WhFJKkqTfYlRikir5nuIySDi0NW2mzWTaTKSuPjqVwmjhqxQ8JoH0TV89buKvStUSfyKEMLRViqiJeLI5KZkG5PK5dLosonKGpmFb5WRpWMCTzkR4otJG0+ShNUeceuoRa/paOQc2GL5h/8PWw7d1NnBuf+r8xlldeKPwurPa+c2nxBUjrhbiqhVcQFx2Jp1OlZeVSwZwNcETiXg2k8/ZlmkwTDbHbF+QyOAJZ2KSc1XhpnnvIUuXHnKvyf+kEZtjb1npWIMZ+Fn0BSiHldiB7bASyl+ISsQ2rK9e/hWxRYgtINgglyqLRniUSypPxJuzmVw2J8kX+6tsgL6HUTN0C0Cexn+vmzrIoG5YIutWQFwFFkkAQfJ+POGphAeSwDNj0YSZjkIQMl991VcfeKZ9w1vtuzBHyTKIbpw5EadUHhEOCHmlZCY5zNRtFeVpAJZuaNj3MABfo1u6vGGJSqwBugosUgEJUemrh+FFbuYql42ZsWzaVCDj/PErflH7hvb2QBNZXkpeXkWWs8hyqBu1mqBs0jCZODYnB8uZ7CjMZcZgPkcJzudtg47uVbo8GqVsc5WGaYijWlbuDtMQRzGiUcKPWT0HtlFoyHx293jkwOgSZRzfbfsYAqpGy4LYkLIY97dNr6jjAIE5nZNHDqionxMA8HdUxcqr/H1NXBs9t+O/dLgYLjPqaib2thACU7giKwpDRBlaeifW1JlwGVykt+1zwuTKygA3dU2unpMZO0FzepxFWu+CKcnGukh8Qa93f1Z3rCoSkjVd2kWLaaTF4GIeRmIpENOig/ikymqQxylY8WEibDFUr0Q8acySRM1FLQ1Skj6XMi1gRAY2nx/jDAGU0JETUAVE4GzCkSEFABmvPDjfGQlbnPF0spvC12ZHk9khbelkdLYGoM6frCL/P0P1l9UevipSpTunOg921M6+ahAqqmKQGjjoqtm1Hc5Dzil6VWTBzFyzn5tBVa4deNQyDZbAUu3ceVXx1vKK1njVvHM1WApLtKNuGSJzUmD7j9imnsAmShWkgN+thsZ0Si5PiSwn4k1NiiyKUbx08By8rCN7VOUy19BpdQbR3gKaygDwg4WvMj+WxQ45/PBD6iPkEpC6iAeph7C8NIywa11st8jFSKfyuaZcWqhLTF5FCSJXtERc5QpPiMt8xi1BPKyxfMLgjvm9U5v3aR66FsrHy6CACgnjmQPfumpUqmNu56xUY8uAgWudT8fJKENAbjTWHngDy6Kmt6Y1WbZnRsi+vk4BzdZy5jB6XFvJS89HaH6LnraQIlsuwzYp+A8psu2EHYoo/r+piK26imy5DQ/a3v8fUWSb01h+0JC/psjotn9UkYbav6uIdGJfHeunt6RG9EkmvJby5HdZecTtk9lMElmGq2oyny+zLXgDCqAE1QAUXmIsqhtdSxoMo6prIsw9pn+0/wIW8KvqhoVMQ5wDa3ALjmuIVV13DRTuKtwjFbvo2cSm7NpFYyYEYaHzjtdDL5eKHe9kYbdrx0uYCixsd7td4IS/gpYmPAi2Q0KAbbi8fS+sklUWBrQ7V/bNDZxAvZOwEoWTWae82J0Jgy6WSBUi49FIMVvN2VzecmdFdgD3/+EXYdHzWvdDBVh0CixXfWDJizmTQ857BcPhN8YadABAK/3da6wC3tB8IHi2b4Lb8EipknjCSDxKnMe9WshmjbzQPlVG+kfNCNwEVnUwxxggyLh/IBoEGTQAYP5zHoLBTAaIH+vcvdL1voe8v0h476FCaR5nzUy0MVGJFFC5ZZWXsU5u2uBTnSsPbZAFcivFYdb/8kF/YRnj4NNgHT6/EYalLQQAvWHDi87cwuoNIdKyvnAyHkQq1Qqe3eZwu8zeoZMoGhQR1ZuBEBHBQkGk4H4uUc09l9U3MPnMADE5BxbaNju/KzH99DKchhO+yrQqEsDvtm/Cg/4xpXC/f1QpiqCHIvCUCkkiAqpx0dwtOycuPKG4ikDRDKvkDfWX3VNjKjgs7+XZOYfyXOjRmL818xW2w2kvbGxhxSz3f+4kvSyPLZyL15NOe9b5WOh2thbOVdUZWydKwo4OV+AciZXsYmaarGbgnMLdkovTQzhL9qxwsgC10KOqWyfOoJikwrnQLdhKFW66bwt0z5AHz9iylT9BSCrBde/FpJaYCKOHMJbs+ZaQhXNX4Xn+xJatxAS9lJNn2RIpQVZR159y0TpFQxOnSJQG3RSzlPHWFfhbTmJOPMYAGQCMlgyKPOlXpfYPsiWiFLmcvecYYDWXyoHhTT+ijCJxH3yjrb90SLNKvt1fWAhb5JVShlhrdu2sHrdaWqaI1VWCF7mTSMfmTLGlki+wDMft41IHDh87J8R9iw/IqQAy4Fz3qbFGB9APniuerXBr550vtJvOmz5Mk5UpS44+Sfvi0ZHu47e/1EFdpSHEAbX9nj1P//IjJrTpX4TPSn733QjutvYqVqvwkPair/gsTwRu7GrlRMcyLQbQ5jPaFqkc+pdwPuP6WYf410AtykCC/LBRHz/0mlkyB9vLAmyBnLfC3F0PrpYEKAUsgxejewFZ2v3hZWcMAO/iOhT6CjzKasOOt5oW/rtKmogLRDcWD/sRNM3A8smjPf12954tBt7ee9Jc7ZsnRgnff9xQ8t2yJeF9YSE+K7K55zwp2pOQqDRDety7lVLJAcMLbq+8iTj3zvCKUtqcrbul7ZGRfyHN/qegAiWhSv8i2EL5bCyp0rRH1ZEqnl85KjLaszRyO/1SR09aETBsUfuTjgkL3zQoFvaJc89v59w2ReXfezRg7cU8MKLpB1nMx/0X4KfsHqmKWMsVoU5ITlAdMaY2J2kStmzbtIUj+ClwJD/0msrXXp7J1eDEiUed9Sb4Nd3Xfx1wZDhjEq7CJfcrvuANNzqvOFcXFuCP+GMwTCwX9jXg//FX3XWQ7SOWfNa2KIaUWKREo5Qp1ftPhV24aTP6qIljKOJU/LQJbCOi4+YfLXwX32NBGeiBtm1aIVlo0QzbZPgeoR9H6NcRehmhB7weSy07J+WBBBIa2naUocpXG/ZUOGCaU2GHI0HcvImo9L4GAvyJ/e4n5WHNiFisECvELTrEmCkB/i+taT/FkyWNkBWBLMeTnhwmvlelutGHQpCCVDBcuFnyviFn8BApQN/Q0K22fIxKLGZSZeH/yjrMDoedn6lVKk7UZToV/hAKSbD98+2t8EfpLHee0ASTmsy6NZhyI3DXi26V0iFhcV9X77GLmCWbCICGpZ2+brgVkNXwKzwRWtY+RgNOlclBnT6hLMKR8DcR/puEL2Y3XSb8ZDaT9gqsPCpKy6t0kQO/IgeWn9Hb5eNmWJXrh83sGTPCQBhVV4MT2peFEhz5sNYDKoIchd8U9B9houu3DYTL8m7n8cYO1130ZIWLGDQqY0VMwPDsw4ZWEBccRLDlVqxSAAvfG6NhIhOeE8ObxCBWjL7iHCBk8GDdKVQIJQYFBC8LbSqGHjY77EnjX3N6rNIIyogWTHTVCUcbPXUCh1bGrHIKo8hyPemzY75KZGNRP9x51lmShBJtMFA6uvgbh+L9xtGWTUfTtB/tbf+4HUhiO5pGic21EX/7M1+qRNkAAHjaY2BkYGAwYwhnYGIAAjApwFAOJKW4p4MEABiYAdYAAAAAFgAWABYAFgBMAIMAqwDAAOkA/gGEAgUCBQIzAo4CvAMXA04DYgN1A4gDmwPPA/oELgRkBI8EwgTWBOYE+QULBRsFLgVpBbwF8QYZBlAGpAbfBxIHQQduB4cHowfTB/8IMAhjCHIIhgiaCKgAAAABAAAAAQAAdWBqS18PPPUACwPoAAAAANiymQoAAAAA2LKZCviR+x4HbgbWAAAACAACAAAAAAAAeNpFxiEMglAUQNH7/oOR6DZxbiSTyWY02TObm8FAJmGfAbPJas8Gm713isXgHEF8f0x/OLuXjjmArIEOdMTDTKIPC7eSdCix5jQeHSRF/0wKHLyP5qwtpasldTXxr7qTacDYevd1J1kGYE18tZK9VlyGhveNMkrNOZhtlLmrJ7e+Na9/GzMDjw18AXIuNDMAeNpjYGRgYLv2W44hij3xx8T/L9jzgCKowAwApaQG1QB42mNgYmZlnMDAysDA1MW0h4GBoQdCMz5gMGRkYkACDQwM7wUY3ryF8QPSXFMYHBgU3v9nVvhvwRDFdo3lkQIDQ38cM1yLAgMjAPoPEIIAAHjaY2BgYIZiGQZGBhA4AuQxgvksDCuAtBqDApDFBiQ1GfQZYhmqGWoZFjAdY7rDzKwkpcytvFZ5u/rLB4wPQ97///+fgQGoTgOoLhpJHRNQHYfybKC6Fw8YHga8/wtU+Pj/nf/X/6/53/+/73/OX/e/Rn95736/y3Wn+k7RDScFHbl7AmZAVxAJGNmAGMZmAhJM6ApAXoQAFlYwxcZAPGDn4MQrz8XAzUANIAiheEjQwssHYwEASs00MAAAeNqsVeWa48gOLYeaYRh8QZ6a9O2blD3MbMfJ8DR+n2vRbvq9vPsMfho5y//20fbISXP3ckNUpVJJR0dShZUhVqtJbIle/aSmF19xY/m9hG+6PG/TLcpXE640s59H1ahaX9drruexsqwi3ekrR0Vp6LNjmNItnyuGNoh/WeDa3Hv9eWc8itfjpfcTT3tunhAvLCQeP7Uu8V1Z3bWWioFRtsHzUA13xFfl/Cos4SwhgMgz4vGFJIWG5GxcVrdldTt1U2uty07bWs1qIdm01ueqIfipNTMAqkcLCdd1yA0dAr5lJ/W5ZjRw0UZRXwtJTgbB5ZNVGq9zteVBH1FOOXwXV+tNpLWYpAtutmQTbXH6dDnBkYuktiP7XDc8ErX7qjKgpoGtDjWx0mHGlbUtdtYRn+stn0cMCciJaP2nmloj8cBPUysmaacEOWr6IxMqisOWt0P2mNlP/njpBTg09Mg4pTjXGW0MmVKusMnkAuQ2Sq42ddYZhJg45jpfxi2FW0ddmjRlQv2J8WqceK72bMvzecoUlUrMG1nH52kDQyKejF7KdSx0aHlKdkvYTWHn8wzczJaUEBhYR1yejlLKU+JpkObzrHm1khS1jY69zFOb+hufT5hXi8mr5YHS9aA/VepPmkLNRKtJMTMTsZOFPNOWJkXrhsWkfEzhg52zmpDHQlIIecg2zHMqw7Y8jWvba3dwjiv4LzUWmfSAvwft/lIdU8BCqVMabEWsHvcdxylrdcqoQlXilYRndEgxT+iQx8FvGlKK8N/PzjpqWoVhnhYnG23+su1eAk2nkdupts9nTOGIPAueRZ4zRVXkeVPURF4wRV3kRVM0RLqmGBH5L1OMivy3KcZE/t9QwM6HPrfKxac+t8vFZz7/xyieav8FjP8Fxv/ANwGjSA8YRV4CRpEaGEVeBkaRTWAUOQeMIv8HjCLngVGkMfSwbDXfIOxsSpHGNpJyQLKRfgsM+232MUlXDFGPjqmEzu5qecZ+0wKt5PPVnfI4Z/lKq6g7Z+Lkqi0TvFYyc+zxdUO3Srw3YOfEh4NgwhD8aL06+52Sn85jfbe47pxBRjeRP/WOwcsqyu76fMsE5x76fPv3TNmJ1mF+ByVRZ5sUUI+Vls5+kec93dMZJWvInx1M9G3HOXMa8e8aoMKA4K804bGovZkHmuhhDl/3do8pGPjgmg7FijiVeX+6mHxboSq531bmqhdtKG/gaES5Lq11F9OHah5AS2Bj8NhXonRDczXKNhYSbDIX61TeoIN3Mk0IPae7qKFGhC7ygiijpHRUEC1RNE5SSK6joeqHvMKjZNQsQeBzYfDK7cZCye8LBwRNfW7IgX4Iah6IGrnqEGdd3ZNgUq2Hoi8TGDKqVpKAHmrPhWZbCWe7lDea2L3Y++07KNRRHTysjJY2fjREEG2XJpWv54MpbpfysdEUCGtdPMwPbVAEzmkM4JMd9cJe9dP91kfaPDN8t32k09DwvXaOwNIsQHvYBmUJOIBptNNhYHenBTVaPdB3h+46eDTwhv+FVuz9U90n8LO7gKXxhOypt2eHGGMhYzv/ruTv6SEB+u7+lHtI+cxgOPtK5vBUwDcxi8+P0b8whXJOn+JbWL80fAfilbAWg1fq5kDxa4/1gBxBAARQNMY9UkznArG9tjlr+1iDC27/UfF11R/T3+y/cDuaf8qI2PqeUUQVhyAm9uEBiCsOQYLmQ5GkASkakKYBGZoXRZYG5GhAngYUaN4URRpQogFlGlCh+VRUaUCNBtRpQIPmVdGkAS0a0KYBhpi34WnuMJiPqq6rJ1WPM8PwrENfzLuwHjC49RC59Qi56VjM+zCdMLjpFLnpDLnpXMyHMF0wuOkSuekKuelanMuTo+Dn6fXavDDM46v4Lvim3OwBEWxNYHjaY/DewXAiKGIjI2Nf5AbGnRwMHAzJBRsZ2Jw2MjBoQWgOFHonAwMDJzKLmcFlowpjR2DEBoeOiI3MKS4b1UC8XRwNDIwsDh3JIREgJZFAsJGBR2sH4//WDSy9G5mAulhTXACYSCQbeNpjQAIAAAwAAQAAeNpMzLWBQmEQBOD57Q53D7EGIMYhfzkRVgoVoCFuFVAKdZDjg2z0rQ2AiPBA4FUWQAs4YdES/2jSCim0aY0g+rSBG1P672fuFjmsaQ8S4kT7fvL9z3wFoe0A5uJMC0TkkJbwyAOt0JBHWiMrr7RBQmXov5+5W/ZUkfYgb1a07yff/8iv3lqjiiXXYSDYZ3/F3B45CtQyMzPftrTObKyA47IU/Po3UZaZyqB2u0HQTHuZqcSOfkd/qFQoTOZKhWKBVtiaSkLHkeEk4pA2k0gFT8XFkYF4grZjndBipMvc6G3rE764PDZ9HjniSquus7Vm4taaWYWppAo0RQ8UuRvJC9QZZ9Y0Eyqoghp5ZZbhi9Ok3zOdTkc1tIuruqukee7Ph6Z+Y6wJpYfM0BwGHeNiOmLLWZvLNFgQ7ekGP1yKCoKT2Njhz+PmtevojEmIuok4sWJrJWXOyMVMx5s7tJ9yMhTvDAUh3S65qIpKwu69pNva1PVVncnPRNPa4iFpNxXEzqVT+byNMpM6q6ypD6ac31/bef0PltFEih4yGFQQw4HwGxH+yFhCQa5J5DwqykNYAcN6bSJfx4gEs+BI3qEwmx4rBO8mFzFylzwh3LZotE9dRCSoDEZD/NuCTwRf4FL6DPqCR3AEltQW6tDSsCZdCZwfM+HZdyg/4ynQKxm5xykfVJ2B5W1hfCdJh/LPyCf3Mvz4bvqcGXT8pdCAhpP8qoxdqJs1z+HPD+7648bajUo/0jxsDhGI0vh5kd8x6/epDRY93Z0QYQ9a3PzqqShJCoSPhbGPnMeCrgV1xJf5hKGiLmPk983etLUEl30/+Rmxd29iR8Z9pF77MHnnUUIIenbKRSj/+Jm92EvQaMtjhNe4krdwD/ZE+8ZFHHrsMIVAeCdXKjgvl0UknUa+nWAlj2Td7XIe++Lf+YrnPxKAWPF42myKwwECABSG35dt23XL3dIg2fYEzdJOtUw89/hLFPKr11VK8q9qn+WTUopRTOKQhjSlJV3po5C7PFCikhtqNGjRoceAERNmLFixYceBExduPHjx4SdAkBBhIkSJESdBkhRpMmTJaS/bRaHQLvx+uVDSnxfr8WS02wy/yruluDYAIIYBIDZSmLqA7f03ejw1isl3Hrx4/4/Nh4WV7X95Dhw5cebClRt3Hrx482H53+27aefxrt57Dt+heA4cOXH+NhNWthvTfGCxAAAAAQAB//8ADw==) format("woff"),url(/static/KaTeX_Size4-Regular-1d1325964eb3838aa3086bb34e36a1cf.ttf) format("truetype")}@font-face{font-family:KaTeX_Typewriter;font-style:normal;font-weight:400;src:url(/static/KaTeX_Typewriter-Regular-4f31d033d446bb37ed6054ae5d39bd22.woff2) format("woff2"),url(/static/KaTeX_Typewriter-Regular-d3c8e68f425df650554fab73fd14628f.woff) format("woff"),url(/static/KaTeX_Typewriter-Regular-b1d1af1a936d0174df3012bd14c56561.ttf) format("truetype")}.katex{font:normal 1.21em KaTeX_Main,Times New Roman,serif;line-height:1.2;text-indent:0;text-rendering:auto}.katex *{-ms-high-contrast-adjust:none!important}.katex .katex-version:after{content:"0.11.1"}.katex .katex-mathml{clip:rect(1px,1px,1px,1px);border:0;height:1px;overflow:hidden;padding:0;position:absolute;width:1px}.katex .katex-html>.newline{display:block}.katex .base{position:relative;white-space:nowrap;width:-webkit-min-content;width:min-content}.katex .base,.katex .strut{display:inline-block}.katex .textbf{font-weight:700}.katex .textit{font-style:italic}.katex .textrm{font-family:KaTeX_Main}.katex .textsf{font-family:KaTeX_SansSerif}.katex .texttt{font-family:KaTeX_Typewriter}.katex .mathdefault{font-family:KaTeX_Math;font-style:italic}.katex .mathit{font-family:KaTeX_Main;font-style:italic}.katex .mathrm{font-style:normal}.katex .mathbf{font-family:KaTeX_Main;font-weight:700}.katex .boldsymbol{font-family:KaTeX_Math;font-style:italic;font-weight:700}.katex .amsrm,.katex .mathbb,.katex .textbb{font-family:KaTeX_AMS}.katex .mathcal{font-family:KaTeX_Caligraphic}.katex .mathfrak,.katex .textfrak{font-family:KaTeX_Fraktur}.katex .mathtt{font-family:KaTeX_Typewriter}.katex .mathscr,.katex .textscr{font-family:KaTeX_Script}.katex .mathsf,.katex .textsf{font-family:KaTeX_SansSerif}.katex .mathboldsf,.katex .textboldsf{font-family:KaTeX_SansSerif;font-weight:700}.katex .mathitsf,.katex .textitsf{font-family:KaTeX_SansSerif;font-style:italic}.katex .mainrm{font-family:KaTeX_Main;font-style:normal}.katex .vlist-t{display:inline-table;table-layout:fixed}.katex .vlist-r{display:table-row}.katex .vlist{display:table-cell;position:relative;vertical-align:bottom}.katex .vlist>span{display:block;height:0;position:relative}.katex .vlist>span>span{display:inline-block}.katex .vlist>span>.pstrut{overflow:hidden;width:0}.katex .vlist-t2{margin-right:-2px}.katex .vlist-s{display:table-cell;font-size:1px;min-width:2px;vertical-align:bottom;width:2px}.katex .msupsub{text-align:left}.katex .mfrac>span>span{text-align:center}.katex .mfrac .frac-line{border-bottom-style:solid;display:inline-block;width:100%}.katex .hdashline,.katex .hline,.katex .mfrac .frac-line,.katex .overline .overline-line,.katex .rule,.katex .underline .underline-line{min-height:1px}.katex .mspace{display:inline-block}.katex .clap,.katex .llap,.katex .rlap{position:relative;width:0}.katex .clap>.inner,.katex .llap>.inner,.katex .rlap>.inner{position:absolute}.katex .clap>.fix,.katex .llap>.fix,.katex .rlap>.fix{display:inline-block}.katex .llap>.inner{right:0}.katex .clap>.inner,.katex .rlap>.inner{left:0}.katex .clap>.inner>span{margin-left:-50%;margin-right:50%}.katex .rule{border:0 solid;display:inline-block;position:relative}.katex .hline,.katex .overline .overline-line,.katex .underline .underline-line{border-bottom-style:solid;display:inline-block;width:100%}.katex .hdashline{border-bottom-style:dashed;display:inline-block;width:100%}.katex .sqrt>.root{margin-left:.27777778em;margin-right:-.55555556em}.katex .fontsize-ensurer.reset-size1.size1,.katex .sizing.reset-size1.size1{font-size:1em}.katex .fontsize-ensurer.reset-size1.size2,.katex .sizing.reset-size1.size2{font-size:1.2em}.katex .fontsize-ensurer.reset-size1.size3,.katex .sizing.reset-size1.size3{font-size:1.4em}.katex .fontsize-ensurer.reset-size1.size4,.katex .sizing.reset-size1.size4{font-size:1.6em}.katex .fontsize-ensurer.reset-size1.size5,.katex .sizing.reset-size1.size5{font-size:1.8em}.katex .fontsize-ensurer.reset-size1.size6,.katex .sizing.reset-size1.size6{font-size:2em}.katex .fontsize-ensurer.reset-size1.size7,.katex .sizing.reset-size1.size7{font-size:2.4em}.katex .fontsize-ensurer.reset-size1.size8,.katex .sizing.reset-size1.size8{font-size:2.88em}.katex .fontsize-ensurer.reset-size1.size9,.katex .sizing.reset-size1.size9{font-size:3.456em}.katex .fontsize-ensurer.reset-size1.size10,.katex .sizing.reset-size1.size10{font-size:4.148em}.katex .fontsize-ensurer.reset-size1.size11,.katex .sizing.reset-size1.size11{font-size:4.976em}.katex .fontsize-ensurer.reset-size2.size1,.katex .sizing.reset-size2.size1{font-size:.83333333em}.katex .fontsize-ensurer.reset-size2.size2,.katex .sizing.reset-size2.size2{font-size:1em}.katex .fontsize-ensurer.reset-size2.size3,.katex .sizing.reset-size2.size3{font-size:1.16666667em}.katex .fontsize-ensurer.reset-size2.size4,.katex .sizing.reset-size2.size4{font-size:1.33333333em}.katex .fontsize-ensurer.reset-size2.size5,.katex .sizing.reset-size2.size5{font-size:1.5em}.katex .fontsize-ensurer.reset-size2.size6,.katex .sizing.reset-size2.size6{font-size:1.66666667em}.katex .fontsize-ensurer.reset-size2.size7,.katex .sizing.reset-size2.size7{font-size:2em}.katex .fontsize-ensurer.reset-size2.size8,.katex .sizing.reset-size2.size8{font-size:2.4em}.katex .fontsize-ensurer.reset-size2.size9,.katex .sizing.reset-size2.size9{font-size:2.88em}.katex .fontsize-ensurer.reset-size2.size10,.katex .sizing.reset-size2.size10{font-size:3.45666667em}.katex .fontsize-ensurer.reset-size2.size11,.katex .sizing.reset-size2.size11{font-size:4.14666667em}.katex .fontsize-ensurer.reset-size3.size1,.katex .sizing.reset-size3.size1{font-size:.71428571em}.katex .fontsize-ensurer.reset-size3.size2,.katex .sizing.reset-size3.size2{font-size:.85714286em}.katex .fontsize-ensurer.reset-size3.size3,.katex .sizing.reset-size3.size3{font-size:1em}.katex .fontsize-ensurer.reset-size3.size4,.katex .sizing.reset-size3.size4{font-size:1.14285714em}.katex .fontsize-ensurer.reset-size3.size5,.katex .sizing.reset-size3.size5{font-size:1.28571429em}.katex .fontsize-ensurer.reset-size3.size6,.katex .sizing.reset-size3.size6{font-size:1.42857143em}.katex .fontsize-ensurer.reset-size3.size7,.katex .sizing.reset-size3.size7{font-size:1.71428571em}.katex .fontsize-ensurer.reset-size3.size8,.katex .sizing.reset-size3.size8{font-size:2.05714286em}.katex .fontsize-ensurer.reset-size3.size9,.katex .sizing.reset-size3.size9{font-size:2.46857143em}.katex .fontsize-ensurer.reset-size3.size10,.katex .sizing.reset-size3.size10{font-size:2.96285714em}.katex .fontsize-ensurer.reset-size3.size11,.katex .sizing.reset-size3.size11{font-size:3.55428571em}.katex .fontsize-ensurer.reset-size4.size1,.katex .sizing.reset-size4.size1{font-size:.625em}.katex .fontsize-ensurer.reset-size4.size2,.katex .sizing.reset-size4.size2{font-size:.75em}.katex .fontsize-ensurer.reset-size4.size3,.katex .sizing.reset-size4.size3{font-size:.875em}.katex .fontsize-ensurer.reset-size4.size4,.katex .sizing.reset-size4.size4{font-size:1em}.katex .fontsize-ensurer.reset-size4.size5,.katex .sizing.reset-size4.size5{font-size:1.125em}.katex .fontsize-ensurer.reset-size4.size6,.katex .sizing.reset-size4.size6{font-size:1.25em}.katex .fontsize-ensurer.reset-size4.size7,.katex .sizing.reset-size4.size7{font-size:1.5em}.katex .fontsize-ensurer.reset-size4.size8,.katex .sizing.reset-size4.size8{font-size:1.8em}.katex .fontsize-ensurer.reset-size4.size9,.katex .sizing.reset-size4.size9{font-size:2.16em}.katex .fontsize-ensurer.reset-size4.size10,.katex .sizing.reset-size4.size10{font-size:2.5925em}.katex .fontsize-ensurer.reset-size4.size11,.katex .sizing.reset-size4.size11{font-size:3.11em}.katex .fontsize-ensurer.reset-size5.size1,.katex .sizing.reset-size5.size1{font-size:.55555556em}.katex .fontsize-ensurer.reset-size5.size2,.katex .sizing.reset-size5.size2{font-size:.66666667em}.katex .fontsize-ensurer.reset-size5.size3,.katex .sizing.reset-size5.size3{font-size:.77777778em}.katex .fontsize-ensurer.reset-size5.size4,.katex .sizing.reset-size5.size4{font-size:.88888889em}.katex .fontsize-ensurer.reset-size5.size5,.katex .sizing.reset-size5.size5{font-size:1em}.katex .fontsize-ensurer.reset-size5.size6,.katex .sizing.reset-size5.size6{font-size:1.11111111em}.katex .fontsize-ensurer.reset-size5.size7,.katex .sizing.reset-size5.size7{font-size:1.33333333em}.katex .fontsize-ensurer.reset-size5.size8,.katex .sizing.reset-size5.size8{font-size:1.6em}.katex .fontsize-ensurer.reset-size5.size9,.katex .sizing.reset-size5.size9{font-size:1.92em}.katex .fontsize-ensurer.reset-size5.size10,.katex .sizing.reset-size5.size10{font-size:2.30444444em}.katex .fontsize-ensurer.reset-size5.size11,.katex .sizing.reset-size5.size11{font-size:2.76444444em}.katex .fontsize-ensurer.reset-size6.size1,.katex .sizing.reset-size6.size1{font-size:.5em}.katex .fontsize-ensurer.reset-size6.size2,.katex .sizing.reset-size6.size2{font-size:.6em}.katex .fontsize-ensurer.reset-size6.size3,.katex .sizing.reset-size6.size3{font-size:.7em}.katex .fontsize-ensurer.reset-size6.size4,.katex .sizing.reset-size6.size4{font-size:.8em}.katex .fontsize-ensurer.reset-size6.size5,.katex .sizing.reset-size6.size5{font-size:.9em}.katex .fontsize-ensurer.reset-size6.size6,.katex .sizing.reset-size6.size6{font-size:1em}.katex .fontsize-ensurer.reset-size6.size7,.katex .sizing.reset-size6.size7{font-size:1.2em}.katex .fontsize-ensurer.reset-size6.size8,.katex .sizing.reset-size6.size8{font-size:1.44em}.katex .fontsize-ensurer.reset-size6.size9,.katex .sizing.reset-size6.size9{font-size:1.728em}.katex .fontsize-ensurer.reset-size6.size10,.katex .sizing.reset-size6.size10{font-size:2.074em}.katex .fontsize-ensurer.reset-size6.size11,.katex .sizing.reset-size6.size11{font-size:2.488em}.katex .fontsize-ensurer.reset-size7.size1,.katex .sizing.reset-size7.size1{font-size:.41666667em}.katex .fontsize-ensurer.reset-size7.size2,.katex .sizing.reset-size7.size2{font-size:.5em}.katex .fontsize-ensurer.reset-size7.size3,.katex .sizing.reset-size7.size3{font-size:.58333333em}.katex .fontsize-ensurer.reset-size7.size4,.katex .sizing.reset-size7.size4{font-size:.66666667em}.katex .fontsize-ensurer.reset-size7.size5,.katex .sizing.reset-size7.size5{font-size:.75em}.katex .fontsize-ensurer.reset-size7.size6,.katex .sizing.reset-size7.size6{font-size:.83333333em}.katex .fontsize-ensurer.reset-size7.size7,.katex .sizing.reset-size7.size7{font-size:1em}.katex .fontsize-ensurer.reset-size7.size8,.katex .sizing.reset-size7.size8{font-size:1.2em}.katex .fontsize-ensurer.reset-size7.size9,.katex .sizing.reset-size7.size9{font-size:1.44em}.katex .fontsize-ensurer.reset-size7.size10,.katex .sizing.reset-size7.size10{font-size:1.72833333em}.katex .fontsize-ensurer.reset-size7.size11,.katex .sizing.reset-size7.size11{font-size:2.07333333em}.katex .fontsize-ensurer.reset-size8.size1,.katex .sizing.reset-size8.size1{font-size:.34722222em}.katex .fontsize-ensurer.reset-size8.size2,.katex .sizing.reset-size8.size2{font-size:.41666667em}.katex .fontsize-ensurer.reset-size8.size3,.katex .sizing.reset-size8.size3{font-size:.48611111em}.katex .fontsize-ensurer.reset-size8.size4,.katex .sizing.reset-size8.size4{font-size:.55555556em}.katex .fontsize-ensurer.reset-size8.size5,.katex .sizing.reset-size8.size5{font-size:.625em}.katex .fontsize-ensurer.reset-size8.size6,.katex .sizing.reset-size8.size6{font-size:.69444444em}.katex .fontsize-ensurer.reset-size8.size7,.katex .sizing.reset-size8.size7{font-size:.83333333em}.katex .fontsize-ensurer.reset-size8.size8,.katex .sizing.reset-size8.size8{font-size:1em}.katex .fontsize-ensurer.reset-size8.size9,.katex .sizing.reset-size8.size9{font-size:1.2em}.katex .fontsize-ensurer.reset-size8.size10,.katex .sizing.reset-size8.size10{font-size:1.44027778em}.katex .fontsize-ensurer.reset-size8.size11,.katex .sizing.reset-size8.size11{font-size:1.72777778em}.katex .fontsize-ensurer.reset-size9.size1,.katex .sizing.reset-size9.size1{font-size:.28935185em}.katex .fontsize-ensurer.reset-size9.size2,.katex .sizing.reset-size9.size2{font-size:.34722222em}.katex .fontsize-ensurer.reset-size9.size3,.katex .sizing.reset-size9.size3{font-size:.40509259em}.katex .fontsize-ensurer.reset-size9.size4,.katex .sizing.reset-size9.size4{font-size:.46296296em}.katex .fontsize-ensurer.reset-size9.size5,.katex .sizing.reset-size9.size5{font-size:.52083333em}.katex .fontsize-ensurer.reset-size9.size6,.katex .sizing.reset-size9.size6{font-size:.5787037em}.katex .fontsize-ensurer.reset-size9.size7,.katex .sizing.reset-size9.size7{font-size:.69444444em}.katex .fontsize-ensurer.reset-size9.size8,.katex .sizing.reset-size9.size8{font-size:.83333333em}.katex .fontsize-ensurer.reset-size9.size9,.katex .sizing.reset-size9.size9{font-size:1em}.katex .fontsize-ensurer.reset-size9.size10,.katex .sizing.reset-size9.size10{font-size:1.20023148em}.katex .fontsize-ensurer.reset-size9.size11,.katex .sizing.reset-size9.size11{font-size:1.43981481em}.katex .fontsize-ensurer.reset-size10.size1,.katex .sizing.reset-size10.size1{font-size:.24108004em}.katex .fontsize-ensurer.reset-size10.size2,.katex .sizing.reset-size10.size2{font-size:.28929605em}.katex .fontsize-ensurer.reset-size10.size3,.katex .sizing.reset-size10.size3{font-size:.33751205em}.katex .fontsize-ensurer.reset-size10.size4,.katex .sizing.reset-size10.size4{font-size:.38572806em}.katex .fontsize-ensurer.reset-size10.size5,.katex .sizing.reset-size10.size5{font-size:.43394407em}.katex .fontsize-ensurer.reset-size10.size6,.katex .sizing.reset-size10.size6{font-size:.48216008em}.katex .fontsize-ensurer.reset-size10.size7,.katex .sizing.reset-size10.size7{font-size:.57859209em}.katex .fontsize-ensurer.reset-size10.size8,.katex .sizing.reset-size10.size8{font-size:.69431051em}.katex .fontsize-ensurer.reset-size10.size9,.katex .sizing.reset-size10.size9{font-size:.83317261em}.katex .fontsize-ensurer.reset-size10.size10,.katex .sizing.reset-size10.size10{font-size:1em}.katex .fontsize-ensurer.reset-size10.size11,.katex .sizing.reset-size10.size11{font-size:1.19961427em}.katex .fontsize-ensurer.reset-size11.size1,.katex .sizing.reset-size11.size1{font-size:.20096463em}.katex .fontsize-ensurer.reset-size11.size2,.katex .sizing.reset-size11.size2{font-size:.24115756em}.katex .fontsize-ensurer.reset-size11.size3,.katex .sizing.reset-size11.size3{font-size:.28135048em}.katex .fontsize-ensurer.reset-size11.size4,.katex .sizing.reset-size11.size4{font-size:.32154341em}.katex .fontsize-ensurer.reset-size11.size5,.katex .sizing.reset-size11.size5{font-size:.36173633em}.katex .fontsize-ensurer.reset-size11.size6,.katex .sizing.reset-size11.size6{font-size:.40192926em}.katex .fontsize-ensurer.reset-size11.size7,.katex .sizing.reset-size11.size7{font-size:.48231511em}.katex .fontsize-ensurer.reset-size11.size8,.katex .sizing.reset-size11.size8{font-size:.57877814em}.katex .fontsize-ensurer.reset-size11.size9,.katex .sizing.reset-size11.size9{font-size:.69453376em}.katex .fontsize-ensurer.reset-size11.size10,.katex .sizing.reset-size11.size10{font-size:.83360129em}.katex .fontsize-ensurer.reset-size11.size11,.katex .sizing.reset-size11.size11{font-size:1em}.katex .delimsizing.size1{font-family:KaTeX_Size1}.katex .delimsizing.size2{font-family:KaTeX_Size2}.katex .delimsizing.size3{font-family:KaTeX_Size3}.katex .delimsizing.size4{font-family:KaTeX_Size4}.katex .delimsizing.mult .delim-size1>span{font-family:KaTeX_Size1}.katex .delimsizing.mult .delim-size4>span{font-family:KaTeX_Size4}.katex .nulldelimiter{display:inline-block;width:.12em}.katex .delimcenter,.katex .op-symbol{position:relative}.katex .op-symbol.small-op{font-family:KaTeX_Size1}.katex .op-symbol.large-op{font-family:KaTeX_Size2}.katex .accent>.vlist-t,.katex .op-limits>.vlist-t{text-align:center}.katex .accent .accent-body{position:relative}.katex .accent .accent-body:not(.accent-full){width:0}.katex .overlay{display:block}.katex .mtable .vertical-separator{display:inline-block;min-width:1px}.katex .mtable .arraycolsep{display:inline-block}.katex .mtable .col-align-c>.vlist-t{text-align:center}.katex .mtable .col-align-l>.vlist-t{text-align:left}.katex .mtable .col-align-r>.vlist-t{text-align:right}.katex .svg-align{text-align:left}.katex svg{fill:currentColor;stroke:currentColor;fill-rule:nonzero;fill-opacity:1;stroke-width:1;stroke-linecap:butt;stroke-linejoin:miter;stroke-miterlimit:4;stroke-dasharray:none;stroke-dashoffset:0;stroke-opacity:1;display:block;height:inherit;position:absolute;width:100%}.katex svg path{stroke:none}.katex img{border-style:none;max-height:none;max-width:none;min-height:0;min-width:0}.katex .stretchy{display:block;overflow:hidden;position:relative;width:100%}.katex .stretchy:after,.katex .stretchy:before{content:""}.katex .hide-tail{overflow:hidden;position:relative;width:100%}.katex .halfarrow-left{left:0;overflow:hidden;position:absolute;width:50.2%}.katex .halfarrow-right{overflow:hidden;position:absolute;right:0;width:50.2%}.katex .brace-left{left:0;overflow:hidden;position:absolute;width:25.1%}.katex .brace-center{left:25%;overflow:hidden;position:absolute;width:50%}.katex .brace-right{overflow:hidden;position:absolute;right:0;width:25.1%}.katex .x-arrow-pad{padding:0 .5em}.katex .mover,.katex .munder,.katex .x-arrow{text-align:center}.katex .boxpad{padding:0 .3em}.katex .fbox,.katex .fcolorbox{border:.04em solid;box-sizing:border-box}.katex .cancel-pad{padding:0 .2em}.katex .cancel-lap{margin-left:-.2em;margin-right:-.2em}.katex .sout{border-bottom-style:solid;border-bottom-width:.08em}.katex-display{display:block;margin:1em 0;text-align:center}.katex-display>.katex{display:block;text-align:center;white-space:nowrap}.katex-display>.katex>.katex-html{display:block;position:relative}.katex-display>.katex>.katex-html>.tag{position:absolute;right:0}.katex-display.leqno>.katex>.katex-html>.tag{left:0;right:auto}.katex-display.fleqn>.katex{text-align:left}</style><title data-react-helmet="true">AI를 통해 변화하는 데이터플랫폼 근황 | Swalloow Blog</title><style>.gatsby-image-wrapper{position:relative;overflow:hidden}.gatsby-image-wrapper picture.object-fit-polyfill{position:static!important}.gatsby-image-wrapper img{bottom:0;height:100%;left:0;margin:0;max-width:none;padding:0;position:absolute;right:0;top:0;width:100%;object-fit:cover}.gatsby-image-wrapper [data-main-image]{opacity:0;transform:translateZ(0);transition:opacity .25s linear;will-change:opacity}.gatsby-image-wrapper-constrained{display:inline-block;vertical-align:top}</style><noscript><style>.gatsby-image-wrapper noscript [data-main-image]{opacity:1!important}.gatsby-image-wrapper [data-placeholder-image]{opacity:0!important}</style></noscript><script type="module">const e="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;e&&document.body.addEventListener("load",(function(e){const t=e.target;if(void 0===t.dataset.mainImage)return;if(void 0===t.dataset.gatsbyImageSsr)return;let a=null,n=t;for(;null===a&&n;)void 0!==n.parentNode.dataset.gatsbyImageWrapper&&(a=n.parentNode),n=n.parentNode;const o=a.querySelector("[data-placeholder-image]"),r=new Image;r.src=t.currentSrc,r.decode().catch((()=>{})).then((()=>{t.style.opacity=1,o&&(o.style.opacity=0,o.style.transition="opacity 500ms linear")}))}),!0);</script><style type="text/css">
     .anchor.before {
       position: absolute;
       top: 0;
@@ -71,12 +71,13 @@
   var mode = localStorage.getItem('theme-ui-color-mode');
   if (!mode) return
   document.documentElement.classList.add('theme-ui-' + mode);
-} catch (e) {} })();</script><div id="___gatsby"><style data-emotion="css-global hms875">html{--theme-ui-colors-background:#ffffff;--theme-ui-colors-text:#121212;--theme-ui-colors-primary:#121212;--theme-ui-colors-secondary:#e9e9e9;--theme-ui-colors-tertiary:#f3f3f3;--theme-ui-colors-highlight:#5b8bf7;color:var(--theme-ui-colors-text);background-color:var(--theme-ui-colors-background);}</style><style data-emotion="css-global 0"></style><div style="outline:none" tabindex="-1" id="gatsby-focus-wrapper"><style data-emotion="css sg0hsn">.css-sg0hsn{font-family:'Noto Sans KR';}</style><div class="siteRoot css-sg0hsn er8jt8f1"><div class="siteContent"><style data-emotion="css 101lz6j">.css-101lz6j{font-family:'Noto Sans KR';padding:0 1rem;line-height:60px;background:#2867cf;color:white;z-index:101;position:fixed;top:-100%;}.css-101lz6j:hover{-webkit-text-decoration:underline;text-decoration:underline;}.css-101lz6j:focus,.css-101lz6j:active,.css-101lz6j:hover{top:0;}</style><a href="#main" id="skip-navigation" class="css-101lz6j er8jt8f0">Skip to content</a><style data-emotion="css 135rxfn">.css-135rxfn{background:var(--theme-ui-colors-primary);width:100%;padding:1.5em 0;}</style><header class="css-135rxfn e1vkxza51"><style data-emotion="css g3texn">.css-g3texn{width:100%;max-width:1050px;margin:0 auto;padding:0 1.5em;}.css-g3texn ul{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;}.css-g3texn li{display:inline-block;margin-left:1em;}.css-g3texn li:first-of-type{position:relative;margin:0;-webkit-flex-basis:100%;-ms-flex-preferred-size:100%;flex-basis:100%;}.css-g3texn a{-webkit-text-decoration:none;text-decoration:none;color:DarkGray;font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;border-bottom:2px solid var(--theme-ui-colors-text);}.css-g3texn a:hover{color:white;}</style><nav class="css-g3texn e1vkxza50"><ul><li><a href="/">Home</a></li><li><a href="/about/">About</a></li><li><a href="/feed.xml">Subscribe</a></li></ul></nav></header><div id="main"><style data-emotion="css ayfizc">.css-ayfizc{position:relative;min-height:300px;height:auto;}@media (min-width: 35em){.css-ayfizc{height:50vh;}}</style><section height="50vh" class="css-ayfizc e1an21f62"><style data-emotion="css ri0e4c">.css-ri0e4c{position:absolute;width:100%;height:100%;}.css-ri0e4c::before{content:'';background:rgba(0, 0, 0, 0.25);position:absolute;top:0;left:0;right:0;bottom:0;height:100%;width:100%;z-index:1;}</style><div data-gatsby-image-wrapper="" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-ri0e4c e1an21f61"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><style data-emotion="css p5ak8x">.css-p5ak8x{z-index:2;font-size:3em;text-transform:capitalize;font-weight:600;position:absolute;width:100%;max-width:750px;padding:0 1rem;top:50%;left:50%;-webkit-transform:translate(-50%, -50%);-moz-transform:translate(-50%, -50%);-ms-transform:translate(-50%, -50%);transform:translate(-50%, -50%);text-align:center;color:white;}</style><h1 class="css-p5ak8x e1an21f60">AI를 통해 진화하는 데이터플랫폼 근황</h1></section><style data-emotion="css 12q3pxa">.css-12q3pxa{margin:0 auto auto;width:100%;max-width:1050px;padding:3em 1.5em 2em;-webkit-box-flex:1;-webkit-flex-grow:1;-ms-flex-positive:1;flex-grow:1;}</style><section class="css-12q3pxa e16x2jx90"><style data-emotion="css wq9lps">.css-wq9lps{width:100%;margin:0 auto 1em auto;max-width:750px;}</style><ul class="css-wq9lps eslpnp81"><style data-emotion="css 1pjs56w">.css-1pjs56w{display:inline-block;margin:0 0.25em 0.25em 0;}.css-1pjs56w a{float:left;-webkit-transition:0.2s;transition:0.2s;background:var(--theme-ui-colors-tertiary);padding:0.5em;border-radius:2px;text-transform:capitalize;-webkit-text-decoration:none;text-decoration:none;color:var(--theme-ui-colors-text);border:1px solid var(--theme-ui-colors-secondary);}.css-1pjs56w a:hover{background:var(--theme-ui-colors-secondary);}</style><li class="css-1pjs56w eslpnp80"><a href="/tag/dataengineering/">DataEngineering</a></li></ul><style data-emotion="css 1i74kp0">.css-1i74kp0{margin:0 auto 2em;max-width:750px;}.css-1i74kp0 span{margin:0 0.5rem;}</style><div class="css-1i74kp0 e13epsic2"><style data-emotion="css 1r5gb7q">.css-1r5gb7q{display:inline-block;}</style><p class="css-1r5gb7q e13epsic1">📅 <!-- -->January 21, 2024</p><span>•</span><p class="css-1r5gb7q e13epsic0">⏱️4 min read </p></div><style data-emotion="css lmr3lw">.css-lmr3lw{margin:0 auto;max-width:750px;}.css-lmr3lw h1,.css-lmr3lw h2,.css-lmr3lw h3{font-weight:600;line-height:1.25;margin:0 0 1rem 0;text-transform:capitalize;}.css-lmr3lw h1{font-size:1.5em;}.css-lmr3lw h2{font-size:1.25em;}.css-lmr3lw h3{font-size:1em;}.css-lmr3lw p{line-height:1.6;margin:0 0 2em 0;}.css-lmr3lw a{-webkit-transition:0.2s;transition:0.2s;color:var(--theme-ui-colors-text);}.css-lmr3lw a:hover{color:var(--theme-ui-colors-highlight);}.css-lmr3lw del{-webkit-text-decoration:line-through;text-decoration:line-through;}.css-lmr3lw strong{font-weight:600;}.css-lmr3lw em{font-style:italic;}.css-lmr3lw ul,.css-lmr3lw ol{margin:0 0 2em 0;}.css-lmr3lw ul li{list-style:disc;list-style-position:inside;line-height:1.75;}.css-lmr3lw ul li:last-child{margin:0;}.css-lmr3lw ol li{list-style:decimal;list-style-position:inside;line-height:1.75;}.css-lmr3lw ol li:last-child{margin:0;}.css-lmr3lw hr{border-style:solid;border-color:var(--theme-ui-colors-secondary);margin:0 0 2em 0;}.css-lmr3lw blockquote{font-style:italic;border-left:4px solid var(--theme-ui-colors-secondary);padding:0 0 0 0.5em;}.css-lmr3lw pre{margin:0 0 2em 0;border-radius:2px;background:var(--theme-ui-colors-secondary)!important;}.css-lmr3lw pre span{background:inherit!important;}</style><div class="css-lmr3lw evtz0ek0"><p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>
+} catch (e) {} })();</script><div id="___gatsby"><style data-emotion="css-global hms875">html{--theme-ui-colors-background:#ffffff;--theme-ui-colors-text:#121212;--theme-ui-colors-primary:#121212;--theme-ui-colors-secondary:#e9e9e9;--theme-ui-colors-tertiary:#f3f3f3;--theme-ui-colors-highlight:#5b8bf7;color:var(--theme-ui-colors-text);background-color:var(--theme-ui-colors-background);}</style><style data-emotion="css-global 0"></style><div style="outline:none" tabindex="-1" id="gatsby-focus-wrapper"><style data-emotion="css sg0hsn">.css-sg0hsn{font-family:'Noto Sans KR';}</style><div class="siteRoot css-sg0hsn er8jt8f1"><div class="siteContent"><style data-emotion="css 101lz6j">.css-101lz6j{font-family:'Noto Sans KR';padding:0 1rem;line-height:60px;background:#2867cf;color:white;z-index:101;position:fixed;top:-100%;}.css-101lz6j:hover{-webkit-text-decoration:underline;text-decoration:underline;}.css-101lz6j:focus,.css-101lz6j:active,.css-101lz6j:hover{top:0;}</style><a href="#main" id="skip-navigation" class="css-101lz6j er8jt8f0">Skip to content</a><style data-emotion="css 135rxfn">.css-135rxfn{background:var(--theme-ui-colors-primary);width:100%;padding:1.5em 0;}</style><header class="css-135rxfn e1vkxza51"><style data-emotion="css g3texn">.css-g3texn{width:100%;max-width:1050px;margin:0 auto;padding:0 1.5em;}.css-g3texn ul{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;}.css-g3texn li{display:inline-block;margin-left:1em;}.css-g3texn li:first-of-type{position:relative;margin:0;-webkit-flex-basis:100%;-ms-flex-preferred-size:100%;flex-basis:100%;}.css-g3texn a{-webkit-text-decoration:none;text-decoration:none;color:DarkGray;font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;border-bottom:2px solid var(--theme-ui-colors-text);}.css-g3texn a:hover{color:white;}</style><nav class="css-g3texn e1vkxza50"><ul><li><a href="/">Home</a></li><li><a href="/about/">About</a></li><li><a href="/feed.xml">Subscribe</a></li></ul></nav></header><div id="main"><style data-emotion="css ayfizc">.css-ayfizc{position:relative;min-height:300px;height:auto;}@media (min-width: 35em){.css-ayfizc{height:50vh;}}</style><section height="50vh" class="css-ayfizc e1an21f62"><style data-emotion="css ri0e4c">.css-ri0e4c{position:absolute;width:100%;height:100%;}.css-ri0e4c::before{content:'';background:rgba(0, 0, 0, 0.25);position:absolute;top:0;left:0;right:0;bottom:0;height:100%;width:100%;z-index:1;}</style><div data-gatsby-image-wrapper="" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-ri0e4c e1an21f61"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><style data-emotion="css p5ak8x">.css-p5ak8x{z-index:2;font-size:3em;text-transform:capitalize;font-weight:600;position:absolute;width:100%;max-width:750px;padding:0 1rem;top:50%;left:50%;-webkit-transform:translate(-50%, -50%);-moz-transform:translate(-50%, -50%);-ms-transform:translate(-50%, -50%);transform:translate(-50%, -50%);text-align:center;color:white;}</style><h1 class="css-p5ak8x e1an21f60">AI를 통해 변화하는 데이터플랫폼 근황</h1></section><style data-emotion="css 12q3pxa">.css-12q3pxa{margin:0 auto auto;width:100%;max-width:1050px;padding:3em 1.5em 2em;-webkit-box-flex:1;-webkit-flex-grow:1;-ms-flex-positive:1;flex-grow:1;}</style><section class="css-12q3pxa e16x2jx90"><style data-emotion="css wq9lps">.css-wq9lps{width:100%;margin:0 auto 1em auto;max-width:750px;}</style><ul class="css-wq9lps eslpnp81"><style data-emotion="css 1pjs56w">.css-1pjs56w{display:inline-block;margin:0 0.25em 0.25em 0;}.css-1pjs56w a{float:left;-webkit-transition:0.2s;transition:0.2s;background:var(--theme-ui-colors-tertiary);padding:0.5em;border-radius:2px;text-transform:capitalize;-webkit-text-decoration:none;text-decoration:none;color:var(--theme-ui-colors-text);border:1px solid var(--theme-ui-colors-secondary);}.css-1pjs56w a:hover{background:var(--theme-ui-colors-secondary);}</style><li class="css-1pjs56w eslpnp80"><a href="/tag/dataengineering/">DataEngineering</a></li></ul><style data-emotion="css 1i74kp0">.css-1i74kp0{margin:0 auto 2em;max-width:750px;}.css-1i74kp0 span{margin:0 0.5rem;}</style><div class="css-1i74kp0 e13epsic2"><style data-emotion="css 1r5gb7q">.css-1r5gb7q{display:inline-block;}</style><p class="css-1r5gb7q e13epsic1">📅 <!-- -->January 21, 2024</p><span>•</span><p class="css-1r5gb7q e13epsic0">⏱️4 min read </p></div><style data-emotion="css lmr3lw">.css-lmr3lw{margin:0 auto;max-width:750px;}.css-lmr3lw h1,.css-lmr3lw h2,.css-lmr3lw h3{font-weight:600;line-height:1.25;margin:0 0 1rem 0;text-transform:capitalize;}.css-lmr3lw h1{font-size:1.5em;}.css-lmr3lw h2{font-size:1.25em;}.css-lmr3lw h3{font-size:1em;}.css-lmr3lw p{line-height:1.6;margin:0 0 2em 0;}.css-lmr3lw a{-webkit-transition:0.2s;transition:0.2s;color:var(--theme-ui-colors-text);}.css-lmr3lw a:hover{color:var(--theme-ui-colors-highlight);}.css-lmr3lw del{-webkit-text-decoration:line-through;text-decoration:line-through;}.css-lmr3lw strong{font-weight:600;}.css-lmr3lw em{font-style:italic;}.css-lmr3lw ul,.css-lmr3lw ol{margin:0 0 2em 0;}.css-lmr3lw ul li{list-style:disc;list-style-position:inside;line-height:1.75;}.css-lmr3lw ul li:last-child{margin:0;}.css-lmr3lw ol li{list-style:decimal;list-style-position:inside;line-height:1.75;}.css-lmr3lw ol li:last-child{margin:0;}.css-lmr3lw hr{border-style:solid;border-color:var(--theme-ui-colors-secondary);margin:0 0 2em 0;}.css-lmr3lw blockquote{font-style:italic;border-left:4px solid var(--theme-ui-colors-secondary);padding:0 0 0 0.5em;}.css-lmr3lw pre{margin:0 0 2em 0;border-radius:2px;background:var(--theme-ui-colors-secondary)!important;}.css-lmr3lw pre span{background:inherit!important;}</style><div class="css-lmr3lw evtz0ek0"><p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>
 오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>
 <br>
 <h2 id="자연어를-sql로-변환-text2sql-sql2text" style="position:relative;"><a href="#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text" aria-label="자연어를 sql로 변환 text2sql sql2text permalink" class="anchor before"><svg aria-hidden="true" focusable="false" height="16" version="1.1" viewBox="0 0 16 16" width="16"><path fill-rule="evenodd" d="M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>
-<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>
-<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.
+<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class="language-text">Databrics</code>, <code class="language-text">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>
+<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>
+쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.
 데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 "자연어" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>
 <br>
 <p><strong>검색 UI 연동</strong></p>
@@ -102,7 +103,7 @@ <h2 id="자연어를-sql로-변환-text2sql-sql2text" style="position:relative;"
       />
         </span>
       </span></p>
-<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.
+<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>
 사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.
 검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>
 <br>
@@ -111,14 +112,16 @@ <h2 id="자연어를-sql로-변환-text2sql-sql2text" style="position:relative;"
     <span class="token string">'my-external-model-openai-chat'</span><span class="token punctuation">,</span>
     <span class="token string">'Describe Databricks SQL in 30 words.'</span>
   <span class="token punctuation">)</span> <span class="token keyword">AS</span> summary
-</code></pre></div>
-<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.
+
+<span class="token comment"># english sdk</span>
+new_df <span class="token operator">=</span> df<span class="token punctuation">.</span>ai<span class="token punctuation">.</span>transform<span class="token punctuation">(</span><span class="token string">'get 4 week moving average sales by dept'</span><span class="token punctuation">)</span></code></pre></div>
+<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>
 이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.
 검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>
 <p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>
 <p><br><br></p>
 <h2 id="기술-문서-검색" style="position:relative;"><a href="#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89" aria-label="기술 문서 검색 permalink" class="anchor before"><svg aria-hidden="true" focusable="false" height="16" version="1.1" viewBox="0 0 16 16" width="16"><path fill-rule="evenodd" d="M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z"></path></svg></a>기술 문서 검색</h2>
-<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.
+<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>
 stackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>
 <br>
 <p><strong>AWS Amazon Q Assistant</strong></p>
@@ -144,7 +147,7 @@ <h2 id="기술-문서-검색" style="position:relative;"><a href="#%EA%B8%B0%EC%
       />
         </span>
       </span></p>
-<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.
+<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>
 AWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>
 <br>
 <p><strong>GitHub Dosu</strong></p>
@@ -175,11 +178,11 @@ <h2 id="기술-문서-검색" style="position:relative;"><a href="#%EA%B8%B0%EC%
 이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>
 <p><br><br></p>
 <h2 id="데이터-거버넌스-도구" style="position:relative;"><a href="#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC" aria-label="데이터 거버넌스 도구 permalink" class="anchor before"><svg aria-hidden="true" focusable="false" height="16" version="1.1" viewBox="0 0 16 16" width="16"><path fill-rule="evenodd" d="M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z"></path></svg></a>데이터 거버넌스 도구</h2>
-<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.
+<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>
 거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>
-<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.
+<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>
 이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>
-<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>
+<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>
 <p><span
         class="gatsby-resp-image-wrapper"
         style="position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;"
@@ -202,7 +205,9 @@ <h2 id="데이터-거버넌스-도구" style="position:relative;"><a href="#%EB%
       />
         </span>
       </span></p>
-<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>
+<p>위 예시는 AWS DataZone 입니다.<br>
+AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>
+<br>
 <p><span
         class="gatsby-resp-image-wrapper"
         style="position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;"
@@ -225,7 +230,7 @@ <h2 id="데이터-거버넌스-도구" style="position:relative;"><a href="#%EB%
       />
         </span>
       </span></p>
-<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>
+<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>
 <p><br><br></p>
 <h2 id="플랫폼에-ai를-사용하는-이유" style="position:relative;"><a href="#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0" aria-label="플랫폼에 ai를 사용하는 이유 permalink" class="anchor before"><svg aria-hidden="true" focusable="false" height="16" version="1.1" viewBox="0 0 16 16" width="16"><path fill-rule="evenodd" d="M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>
 <p><span
@@ -250,7 +255,8 @@ <h2 id="플랫폼에-ai를-사용하는-이유" style="position:relative;"><a hr
       />
         </span>
       </span></p>
-<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>
+<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>
+플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>
 <p><br><br></p>
 <h2 id="reference" style="position:relative;"><a href="#reference" aria-label="reference permalink" class="anchor before"><svg aria-hidden="true" focusable="false" height="16" version="1.1" viewBox="0 0 16 16" width="16"><path fill-rule="evenodd" d="M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z"></path></svg></a>Reference</h2>
 <p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>
diff --git a/page-data/index/page-data.json b/page-data/index/page-data.json
index ecb3c0f..39ff1f7 100644
--- a/page-data/index/page-data.json
+++ b/page-data/index/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-posts-js","path":"/","result":{"data":{"allContentfulPost":{"edges":[{"node":{"title":"AI를 통해 진화하는 데이터플랫폼 근황","id":"3bc2c838-2281-5852-899f-ba16e366f41b","slug":"llm-dataplatform","publishDate":"January 21, 2024","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}}},{"node":{"title":"Pandas 2.0의 Copy-on-Write에 대하여","id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}}},{"node":{"title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}}},{"node":{"title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}}},{"node":{"title":"베를린에서 2개월 살아남기","id":"ab300765-6809-53b6-a6cd-952c7dd3c976","slug":"berlin","publishDate":"May 10, 2023","heroImage":{"title":"cover-personal","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&q=50&fm=webp 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&q=50&fm=webp 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&q=50&fm=webp 1400w","sizes":"(min-width: 1400px) 1400px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&fl=progressive&q=50&fm=jpg 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&fl=progressive&q=50&fm=jpg 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg 1400w","sizes":"(min-width: 1400px) 1400px, 100vw"}},"layout":"constrained","width":1800,"height":1062,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAAMABQDASIAAhEBAxEB/8QAFwABAQEBAAAAAAAAAAAAAAAAAAIDBv/EABoQAAIDAQEAAAAAAAAAAAAAAAMRAAECEiH/xAAVAQEBAAAAAAAAAAAAAAAAAAABA//EABURAQEAAAAAAAAAAAAAAAAAAAAR/9oADAMBAAIRAxEAPwDlAjvdNSiD5p35M8m2PbxaVKSQuy296alalC1EiIF//9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>우연히 회사에서 좋은 기회를 얻게 되어 독일에서 2개월 근무한 후기<br>\n베를린 생활부터 유럽의 개발 문화까지 그 동안 겪은 경험을 정리해보려 합니다.</p>\n<br>\n<h2 id=\"베를린-아파트\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EC%95%84%ED%8C%8C%ED%8A%B8\" aria-label=\"베를린 아파트 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 아파트</h2>\n<p>숙소가 정말 평이 좋고 실제로 시설도 좋은 아파트인데 엘리베이터가 없었다.\n여기는 그라운드 개념이 있어서 5층이 한국으로 치면 6층인데 다들 아무렇지 않게 걸어올라간다.\n빨래, 건조를 하려면 6층을 왕복 3번 다녀야 하는데 이게 제일 힘들었다.</p>\n<p>그리고 모든 문을 열쇠로 열어야 하는데 이게 정말 난감하다.\n최근에 열쇠를 들고 다녀본 기억이 없다보니 두고 다닐 수 있는데\n열쇠를 두고 오면 한화 약 20만원 정도의 벌금을 내야한다.\n열쇠 분실로 인한 사고 방지를 위해 문을 교체해버리기 때문에 저런 비용이 발생한다.\n개인적인 생각으로는 그냥 도어락을 도입하는게 나아보였다 🙏🏻</p>\n<br>\n<h2 id=\"베를린-교통과-생활\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EA%B5%90%ED%86%B5%EA%B3%BC-%EC%83%9D%ED%99%9C\" aria-label=\"베를린 교통과 생활 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 교통과 생활</h2>\n<p>처음 도착하자마자 놀란건 일요일에 모든 마트, 식료품가게가 문을 닫는다는 것이다.\n만약을 위해 베를린 전체에서 세 군데 정도 대형마트만 문을 연다.\n결국 생활용품을 사기 위해 베를린 중앙역까지 갔는데 뉴스에서만 보던 그림을 볼 수 있었다.\n재난상황마냥 줄이 끝까지 이어져있고 마트 내부 물품은 다 털려있었다.\n그래도 독일은 국가가 통제하기 때문에 마트 물가가 정말 저렴하다.</p>\n<p>베를린 대중교통으로는 트램, 지하철, 버스를 제일 많이 탄다.\n종일권을 끊으면 모든 교통수단을 무제한으로 탈 수 있다.\n근데 이 보다 더 좋은 교통수단은 자전거다.\n자전거 도로가 너무 잘되어 있어서 대중교통 이용하는 것보다 시간이 빠를 때가 많다.\n도시 간 이동으로는 flixbus와 ICE 고속열차를 많이 이용한다.\n독일의 고속철은 워낙 악명 높아서 취소되는 일이 빈번하다 들었는데\n역시나 당일 오전 출발 5분 전에 ICE 열차 취소를 겪었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 37.53753753753754%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAPCAIAAAAZNRq0AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAABjpJREFUGBkFwclvHWcBAPBvvu+bfebN2+3nF+92EjuJ4yxt1UBSSumBQiVAVAKhHoALJ/4Gzty4VOIKSAj1gAQFoTaUUBK6KDR1XhI7jpfnZ/tt87aZ8azfxu8n/ea994CEHz5rvPPdt+5+9Pfc7JRt5DQ59+9PPpla3nCqFd1SjTQCKPP8aMFRmVY488Kz8ah90t1r9yLfRzxDlBAuYdWy6yuJPyisbEBVB0ACgkNJqFbBsR3dzutWnhL6wW9/rQmGwyQOwrhYcdrdY0Vz+t1EW5wyZfXyrVcKBQcAhJJQl9HRUWfoTnaHg27nGENSr+aK9TlNwSlns4sroyAUw757epwysfK1N7XidBiGgpHza5eKtXOMMIRkDCGEKMvSnOMwb4gVRZnJF563DiTVsCqVcsGuFy0R00F7dLi7F3je0O0urq6/aD576dbVixvrC8tvcSbFoY/t5d5f7xfqS1kQVhfmU8uuL612g3R1bXU8OXOs8uqlSxCpCEKKmeBCkbEEJJZSXcPuiYfbzX2OdAZSCybCGx02vrjXn1xYW9/Z3Zqbr9emjZevXoHmufx8fvnCatQZ9E7iYSApetWKWXXpCmM0HXUK52+OHn+cU3iIk1K5uLZ5nRLqjbx82c6yTMcSQjKjFGMZaxIksSIjjEROywZ+++gfrYObt+5sXrjlEkXF1u3XXgGC9/udiAga8OfH1QeNYcVCjkx3E/nSOTE/rbY//aOuayUbxXsCcWZbts1UW5NNxOIkq+RUzBJNQUIIwYmiYxnDVEKWba6/fgdfuHqRhqNBTJZny7ff+M7RUXOq/3TkD6OJmgJFMCwIkZCMLBmztHcWYBw7lAQt6WCgdFsntm0uvv7mchUfnp4xFhgSnAJRLn66VFjyvLhU1LM0ev8Pf37nx99XFGXvxc7dD+939nqJO8YvGo9yC5v1zW+PDx+2d7ZTAIi+kLiHlflp6p4UrErkEUs3jK2PZ6FfzikykkOR03OqMNDdo/3DNGvtv/j5uz+cKVUePe9CTrbu/qXVGcscFAsalFEcJ+2j8T0H/+7375/FPkuTvFPaORxJv/jlr85bhnPtxs4//5QwdaM05Zq5Z82hYYqUiEU7/N+OO1s1L0/N+P3jvVGXI3W75d15ed4NNEz9ZnfonR4dj7yLF9dWr726s71rWVYYRuVSKQzPsKJRQkAcjfzR9pOGAADxjFCCOEBf/+aP2l+2gjhw3bbnTZqDyeP9fhx6p83DUXfy9m3rSd85g3a373YG/o4bQafWm5COJ/UGbaDl7yyeu7G8SmuVxqNG6+jULk5326eAU8BIGoVrwejG6vqrP/jJaaf1fPspt6fTLBGcUZoh03A8aAYs0HigabqXZI0nDwmj1zaXdvd3HzwZu24v9nqKIscSm7JRY3v/5Gi3WCgszOUef3b/YOA2esMsSlVN1zRrNBraOadQKmd+b/b6G/Pf+2kys/Lwwd0vP/2Xp1czhkDqyyxmXEBHrS9U5077vf3OsJ/AEOpY0SYT779bbrFUKdXmE8KRJBmmYeja29+4TEjCGH2x04DQquo0mXR7B8/c9olsV4IzX5JAvliu1FcufutnWnGuubu//Z+/dZvbIUc46CmDhkx9IEEIJVyyEij3Zeo32y5zliw7VyhXRmcaAIgxJquqpcJabdq2dIDze8e9mbxCSdHWZX84GBCNZAkwSmbt/KDdgrK2duUlq1jjQozbTc65o/KKBeaubUwyEQdeLGky5CyL6/UFPPb6Js8URZ2aqiIIJCAopWk0tnMmVBSeTGrTJU4TSlQZSh980d64tPHu9ZulQunDex9tb32ODSdfW5Fosrx6pViuSYqRpkk0GZLI1xCL5NSNU920Zgz2LMs4SYUqSwhTSnA90a+n1mc5tgf5JEnytlktFyXoF3JM102WxkgCksAZpSO/m9f43Ny8bhUyIcVJgkxnZvGKYVhQNrBsEChnwdgbdrMo0FkiFPb53j6holYpBV6vXqnsUpnHXRnh/tDF60Nqm5lqcqzpc4XywvnLB1+NuQRN01AxYhAQSgXCUUYpgERCcUqiKEQyplm2vvma4CAhXBKQEDI63ovGfUASQFMgMqLgie/LED7Z6dm6rKZETYngCRUYAPB/NzaH9Z6KIwIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오전 ICE 전체 지연으로 베를린 중앙역이 전쟁터가 된 모습, 환불을 받기 위해 전부 줄서있는 모습</p>\n<p>6시간 연착이라고 당당하게 설명하는데 사람들이 너무 당연하게 받아들여서 당황했다.<br>\n근데 더 놀라운 것은 환불 절차다.\n한국은 유럽과 같은 은행코드를 사용하지 않아 앱에서 환불 받을 수 없었다.\n방법은 DB 본사에 우편으로 직접 적어서 보내는 것 밖에 없다. 당연히 이메일도 불가능했다.</p>\n<br>\n<h2 id=\"베를린-음식\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EC%9D%8C%EC%8B%9D\" aria-label=\"베를린 음식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 음식</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 37.53753753753754%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAPACgDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAcDBggE/8QAKhAAAgIBAwMCBQUAAAAAAAAAAQIDBBEFEiEABgcUQRMiMVFxCBUyM5H/xAAXAQADAQAAAAAAAAAAAAAAAAABAgYH/8QAJREAAQMDAwMFAAAAAAAAAAAAAQIDEQAEIQUSMUFRYXGR4fDx/9oADAMBAAIRAxEAPwBad4eZrXY96XSamnpeSrEI3ZpsOHaNjkL7hdyn8j/L/S1nV56GkrdpGV78QxMFYLECx3SbTjdhD+M45yMGk+dP006v213ZZ1OXUCiz5sNNGElQbiU+UHaw/rxjn6dRLqs0ENSvsns1aldY64s6izFZQMliPhEncx5y38eAMcGXv7fVEylgFJmcEce/7Wm2txpbjCXDChHP3rXNe7dn1XyxpP716GdZoI5JmijWcQpXZd0Qc5Cb2sAH3G336Z3kLXZa1Onclodv2UoCWaO2+myfErrhd4RxIcHGFYr9OOOcdJHzXr3dHiSKlW0+w0mq6nJPM0sVorJAyOrkK+0KclxkbQDtH24TE/mfV7GgvZu3LGrNNGVb1FmTflhyxY55BAPvyo+w6V7Tb65fSp1UQBuGM4EnxPEDtUW7eWyNwaTukmDxAnA81pMd214NYo6pc7S0a9p2/bdt6dpqC7CHjBWwr8uwUuu4qSRyQDyejrK2hdx6u8cST339OsW8x4+Z190Z1wSMEjn2GPpjo6CtDcbOx5zI7Tx0n4oG/t1Hc0ggH058V//Z'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>베를린은 너무 다양한 인종이 살고 있어 전 세계 음식을 다 먹어볼 수 있다.<br>\n그 중에서 독일 음식은 흰색 소세지와 커리부어스트만 먹어보면 된다. 나머지는 별로였다.\n햄버거의 어원이 함부르크에서 나온 만큼 수제버거도 맛있는 곳이 많다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 37.53753753753754%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAPACgDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAABgcAAQQF/8QAJxAAAgEDBAICAgMBAAAAAAAAAQIDBAURAAYSIRMxBxQjMiIzQVH/xAAWAQEBAQAAAAAAAAAAAAAAAAAGBAX/xAAkEQABAwMDBAMAAAAAAAAAAAABAgMEABEhBRJhMXGRsVGBof/aAAwDAQACEQMRAD8ASG1dt3m1VDbmeBrBI6GlnuH5HE8jRsGSGLH8iVBUvjiM9nTN21S7XuFprp6yhpXmWEvGtbVSR1DHjyLo4jEZzyU8CAfeM+tXvO23K3bjiv0V2krHpofG9BN1H4wCMIe+PRxjvP8A0aWN73zQT/Z8VsejgqiuIRJ+BDkEsIx0D79DRXS340uIlMhaR8g3uOxOfGLYpNqDEpqUpyO2q5yCnAPe2Ps5vmiK2/F20NzV0ldeYKi4/SieNLfAQ0Rlk/UuofyN/W2AvvPsY7211o2VYLFV3jam06aga3oppLnTUhnkikZQQJULthXYkAhlI5DphnQX8Zbghq7pfp1X7TYp0Zy7wnIDk8SpBAz/AIc+h7wDrsXquncv4KSioaEyLJJDQwhHlKkFS0hJY4IBwOIJ9gnvRmZKQ3PW2hVkDAHHUe6Rx4b70NCnE3cIuTz781dm+UFtcyQ7h2lHZrZNEi/c+mgj5kAc3cEhVZvXWO/YxnU0L3vhuGFkKT3CSR2861NSyxYKgLkgcsDH64bo4z1qajMSG4dy17Dwf3NaTUqekWDe7kiv/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>보통 해외에서 새벽에 다니면 위험한 경우가 많은데 베를린은 서울보다 더 밤새도록 노는 도시라 정말 안전하다.<br>\n오이스터 바에 가면 비싼 돈을 주고 굴을 먹을 수 있는데 비린내가 안나고 우유 맛이 난다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.030739673390975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAATACgDASIAAhEBAxEB/8QAGAAAAwEBAAAAAAAAAAAAAAAAAAYHBQj/xAApEAABBAEDAwQCAwEAAAAAAAABAgMEEQUABiEHEjETFCJBQlFhgZHB/8QAGQEAAgMBAAAAAAAAAAAAAAAAAgMBBAYF/8QAIREAAgICAQQDAAAAAAAAAAAAAQIAEQMhBEFRYaEFEhP/2gAMAwEAAhEDEQA/AI217VEcFx1KBVUVdtnS11NbLew8gPYONNSWT6T6kEJcpQvtP3X8aVZW+ME9LjPvPBVJBUlCnkAnsAoEpock/WtXcHULG5XZrePGRXOfSwlDLae8rZUAnuSlJB4+IPkWSTVknSm+VU5PzKGj1o+a91La8CsRyFhY6a8X6uRqFsSbkoRlxozjjIQtYCB6h+NdxNDgc3z9A6ZsT0tjTtoY/JqS+qY9l0QltpICfSKfPjg3xfjT9s5nP56FOXC2+jHYptCBJn5t0Q2G+9IpVCiU/l8Qb4u70z7Y3BFhY+Z72W5kttxVhU/JJaMaGgpICUNLUlTri+eBaAb5Fc6S+f6qbO+0SqAkSG7x6bvxNzZOFjse60zHV8GXF2pKbrkmrPB0apfV3qw5nNhRc5Exj8MzJr6Y7jjoV2gVffQvxRCSo8q7rpQBNRjzM66hOiKZCJiitACiSKUP8ST/AMGs7Fvue4RaibNc86NGmUITmVPbWam53L46NOfMiLCkRm48cgBpAtP4AAE8nki9dL9R0Ji9J8NAbQkQlNKdVHKQUFRUuyQfJ4/rn9nRo1nuZorXeWeLstc4Kym4cnKjyMW7kJLmNYecW1DU6fSbUVAEpT4HAHj9DRo0a0igAanOJuf/2Q=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg?w=521 521w,\nhttps://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg?w=1041 1041w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>때마침 베를린 빛 축제가 진행 중이어서 관광지에서 다양한 야경을 볼 수 있었다.</p>\n<br>\n<h2 id=\"베를린-개발-문화-스타트업\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EA%B0%9C%EB%B0%9C-%EB%AC%B8%ED%99%94-%EC%8A%A4%ED%83%80%ED%8A%B8%EC%97%85\" aria-label=\"베를린 개발 문화 스타트업 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 개발 문화, 스타트업</h2>\n<p>유럽도 일하는 방식은 비슷했으나 한국과 비교했을 때 일을 디테일하게 한다고 느꼈다.\n예를 들면 RFC 문서를 정말 자세히 작성하고 오픈소스와 같은 플랫폼 운영 방식을 가지고 있었다.</p>\n<p>그리고 정서 상 한국은 정말 겸손한 반면 여기는 잘한 일이 생기면 자랑하고 모두가 축하하는 분위기였다.\n해외 감성으로 네트워킹, 파티도 자주 열린다.\n독일은 아프면 바로 병가를 15일까지 낼 수 있고 휴가가 25일이다.</p>\n<p>금요일에는 모두 일찍 퇴근하고 앞에서 맥주를 마신다.\n모든 과정을 경험해보니 절대 한국만큼의 개발 속도가 나올 수는 없겠다는 생각이 들었지만\n반대로 유럽에서 여유롭게 사는 법을 배운 것 같다.</p>\n<p>데이터 분야에서는 특별한 차이가 있는데 개인정보에 대한 사람들의 인식이다.\n한국에 있을 때도 많이 들어봤던 GDPR이라는 규정에 대해서도 알게 되었다.\n대부분 사용자들은 개인정보를 절대 서비스에 넘기려하지 않는다.</p>\n<p>그러다보니 데이터 기반의 서비스를 만드는 사람들은 정말 난감할 때가 많은데 개인화 추천이 가장 대표적이다.\n일단 사용자를 식별해야 개인화를 할텐데 여기는 개인을 정의하는 것부터가 어려운 문제다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 75%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAeACgDASIAAhEBAxEB/8QAGgAAAgIDAAAAAAAAAAAAAAAABgcABQMECP/EADAQAAIBAwIEBAUDBQAAAAAAAAECAwQFEQAhBgcSExQVMUEIIlFhcSMysUJygZHw/8QAGAEAAwEBAAAAAAAAAAAAAAAAAwYHBAD/xAAqEQABBAECBAQHAAAAAAAAAAABAgMEEQAFQSFRYXESMYHwExQicrHB8f/aAAwDAQACEQMRAD8A6bMakhd/sDrYprcZGyoBPruRrJWRRUVrq69yJVpomlZQekHpBOM7+uNLG/8AxN8O2KkZrZQ1V2kI+UtiGM/cE7kf4GiydTiRSA6uj75YCPp8qULbTY97nAznNxzd6Dm5Q2KGpaOjTwc6wxkL85kOc4GXHyrsTj7b6b0l/Wr4co1lhQyvGsg6dsEgHXJvMLjur4z4nqeIzTRUtf5e0kDRlv0+30lCBnOcn1/jV1ceaPENoqeVtBHXsLbXww+KBVS85KLgM5Bb+r676TImvJjag4++VFtd+EfbZ58Ppv8AGN8jRFyYaGWAkLTVnuADtx44/wCCrQu6BimBufU51NAF44/sdhofE1FwdGeOSQwpC7yAIMuCADuBv+NTVERqEKSkOtvpII5j2PXEMwZzBLa2FWOhzJzL+IaovtlrOG7bDNDHJIFeuJAaWMOCY+jAK9QVgTk+59MZSNUzVMxhmKKZBgIDsB9AMH/hpbLzAvnbEjPSp2sxKY4AWwAFG7ZJOFAznOq2180XgvVT5jSR1ywoGjkKYZTkZ2yP51HJEWdJV8R4glI2/gGVWOqKyPBH4Ane8M6+vFFboxPMobwFYhCgsMpLEvsQPcas7nW+YcOcJ100pglswo6mjfAKzIBH3kY5ypXKEHBBHUNA1dxtbakJH5FEEdpRlZCrdLOrMPQ+vSD+RrXruJZbjY6S1mkENFFH2VAqOpgO2d/2DJzj/QPtg98m66EkpqiTt5G+vp2zSHQ0TS7uvK9q6YZ3vmfa7nekavBo2pLkYioQuHgkV4Sds5x3Mn+0Y1NJbjm6W+xR+JqI6tpapm6exIoC4UvncfVRqa1p0BpxIKFKSByI/YPXAuau42ohYBPbP//Z'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg?w=1008 1008w,\nhttps://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg?w=2016 2016w,\nhttps://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg?w=4032 4032w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>베를린의 옛 건물을 내부만 리모델링해서 사용한 스타트업 공유 오피스도 방문했었다.<br>\n자동차 회사가 많은 나라답게 다양한 모빌리티 스타트업을 만날 수 있었다.<br>\n베를린에는 유럽 내의 스타트업이 많은 편인데 이 도시가 유럽에서 가장 글로벌하기 때문이다.<br>\n시골로 내려가면 기술에 대한 거부반응을 가진 사람이 많은 반면 베를린은 해외에서 온 이민자가 많다.\n그래서 독일어가 있음에도 영어를 정말 많이 사용한다.</p>\n<p>개발자 한정 2년만 근무하면 시민권도 쉽게 얻을 수 있다.\n대신 세금으로 절반을 가져간다 💸<br>\n이 말을 듣고 한국에서 살아야겠다는 생각이 들었다.</p>\n<p>인터넷이 정말 느려서 불편하다고 생각했는데 이 정도면 유럽에서 엄청 빠른 편이라고 한다.<br>\n하지만 스웨덴 스톡홀름에 가보니 독일 인터넷이 느리다는걸 확신할 수 있었다.</p>\n<br>\n<p>어쨋든 무사히 돌아와서 다행이라는 생각이 들었다.\n영어로 일하고 회의하는 것은 정말 많은 노력이 필요했다.<br>\n대신 유럽에서 근무하면 주말 동안 주변 국가 여행할 수 있다는 점이 큰 장점이다.<br>\n요즘 재택이 많아지다보니 해외에서 근무 가능한 회사들도 많이 생기고 있는데<br>\n만약 유럽에서 살고 싶다면 베를린에서 살아보는 것도 괜찮은 것 같다.</p>\n<br>","excerpt":"우연히 회사에서 좋은 기회를 얻게 되어 독일에서…"}}}},{"node":{"title":"MLOps 관련 책, 강의 리뷰 (DMLS, FSDL)","id":"8a70bf4b-6469-516d-9b3f-43f3fa109774","slug":"mlops-dmls-fsdl","publishDate":"September 13, 2022","heroImage":{"title":"cover-personal","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&q=50&fm=webp 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&q=50&fm=webp 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&q=50&fm=webp 1400w","sizes":"(min-width: 1400px) 1400px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&fl=progressive&q=50&fm=jpg 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&fl=progressive&q=50&fm=jpg 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg 1400w","sizes":"(min-width: 1400px) 1400px, 100vw"}},"layout":"constrained","width":1800,"height":1062,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAAMABQDASIAAhEBAxEB/8QAFwABAQEBAAAAAAAAAAAAAAAAAAIDBv/EABoQAAIDAQEAAAAAAAAAAAAAAAMRAAECEiH/xAAVAQEBAAAAAAAAAAAAAAAAAAABA//EABURAQEAAAAAAAAAAAAAAAAAAAAR/9oADAMBAAIRAxEAPwDlAjvdNSiD5p35M8m2PbxaVKSQuy296alalC1EiIF//9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>MLOps는 다양한 지식과 컴포넌트를 다루고 있어 따로 공부하다보면 중요한 부분을 놓치고 도구에만 집착하게 되는 경우도 많습니다. 반면 알려진 책이나 강의를 들으니 퍼즐 조각들이 맞춰지는 것처럼 흩어져 있는 지식들이 하나로 정리되는 느낌을 받을 수 있었습니다.</p>\n<p>이 글에서는 MLOps 관련 자료 중 유명한 <strong>Full Stack Deep Learning</strong> 강의와 <strong>Designing Machine Learning Systems</strong> 책을 리뷰해보려 합니다.\nMLOps에 대해 관심있거나 시작하기 위해 자료를 찾는 분들에게 도움이 될 수 있을 것 같습니다.</p>\n<br>\n<h2 id=\"full-stack-deep-learning\" style=\"position:relative;\"><a href=\"#full-stack-deep-learning\" aria-label=\"full stack deep learning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Full Stack Deep Learning</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.41630901287554%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAqlQTFRFQVStcGiQRVivXGy4V2i2Xm65VGS1W2u4RlivQFOtQlStZ3a9RlSZOkiOQE6ROEeNM0KKPlCnVme2V2e2UGGzVWa1SlyxQVSvVWOtQlWwSFuyS12zSVuyTF6zTF60RVexT2G1OkucPU2cPU6cOkqaOUmZQFKrR1qySl2zSlyzQ1WwVGW3RlmxRVixT2C1TV+0QVSwQ1WzRFe3RVi7Rlq/dILOYXLIZnfKd4XPbHvMX3DHaHjKZnbKanrLXm/HYHHHUWTDW2GtbWieaGajTVy4R1vDf43Vk5/ccoHRipfZj5vakZ3bcIDQiZbYmqXeaHnObmmhwYRT0YlB7bVn5qVU04lAoHlxTV29SFzGVmnLSV7HSl7HSl/HUmXJSV3HT1/B3JFFz4U8zolD775w4adbzoQ835A9mnp+SV7Kj5vep7HmsbrolaHhpa/lpK7lf47aWGS/3I8/zII81Yk91Ig84pI+rIN1Sl/OU2jRUmfQlZvH6qFH55tD5JU+5JQ+3JA/2ZJD1Kl8YHPQS2HSTGLSZXfYXnLXYHTXY3bYYXTXZXjYYnXXXnHXZHfYZ3nZZnnZWW3VXnLTz9LQ6Z5F6qJI66NI6J9G3pRC37aCpLDYTGPWW3DZU2nYVGrYU2nXV23YVmzYVWvYVmvYUmjXXnLRzNTZ2raN6aFI3JtU0czDoq7RTmXaaHvfYHXeaHzfaX3gan7gZHjfZ3vfZnrfYXbeTmXZlZ6+ytLX0czE2LmX2rKF2bSK1cGoz9TWvcTJZ3jKT2beUWneW3HgVm3fUWjbdIHAoai6trzAvMLGusDEsLW8jZe6X3HNUGjiW3LjUWjibYHmZ3zla3/mcYTnaH3mWXDjXHLkUGjhVmzaXHDUWm/WUmnfUWnlVm7mXXTnW3LnUmvpU2ztVG7xxYsqCgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAADbSURBVBgZjcELTsJAFEDRe8MToYIVhLAN978jNUEDGPyExplO+SXG9BxRMUE5swBsbWNlcSA+uTA2A0w2ta4WvjHXwyv/8ol+QvoJ6Sekn5CWF3Z0puo7RcxomWByCG9o3ZnNXZPFIy2zZvBNMia79YgsHmhZfHEyMmm2tZJFzZmOOBmYMNXJB0lMyDz7GeIW7n1eKSYvJLGiZefQDKGpoHLhGpqFShIzWh7tSSqo1LkFSSzJlMIJnbCzW5LElMyiGbjnpDLZMCWLmkwpHHKtpojgWvC3kH5C+vkFpuwhkVffvwIAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADIzMzD8QLLwAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTk4oL5yIAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"fsdl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png?w=583 583w,\nhttps://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png?w=1165 1165w,\nhttps://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png?w=2330 2330w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>FSDL 강의는 MLOps 전반적인 주제를 모두 다루는 온라인 강의입니다.<br>\n아래 사이트 또는 유튜브에서 최신 강의를 볼 수 있습니다.<br>\n링크: <a href=\"https://fullstackdeeplearning.com/\">https://fullstackdeeplearning.com/</a></p>\n<p><strong>좋았던 점</strong><br>\n매년 강의의 내용이 최신 트렌드를 최대한 반영하기 위해 업데이트 되고 있으며 Lab이라는 실습 과정이 준비되어 있습니다. CoLab 환경에서 실습할 수 있도록 자료가 준비되어 있는데 특히 ML 테스트 챕터의 자료가 좋았습니다.<br>\n중간에 다양한 오픈소스나 도구들을 소개해주는데 직접 구축하는 경우에도 아이디어를 얻을 수 있어 유용했습니다.</p>\n<p><strong>아쉬운 점</strong><br>\n많은 내용을 다루다보니 특정 주제는 간단하게 이미지나 링크만 공유하고 넘어가는 경우가 있어 설명이 부족한 경우가 있습니다. 제대로 이해하려면 제공되는 학습 자료들을 모두 찾아서 봐야 했습니다.<br>\n절대 사용할 일이 없을 법한 초기 스타트업들의 SaaS를 소개할때가 있는데 광고를 받은게 아닌가 싶은 생각이 들었습니다.</p>\n<br>\n<h2 id=\"designing-machine-learning-systems\" style=\"position:relative;\"><a href=\"#designing-machine-learning-systems\" aria-label=\"designing machine learning systems permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Designing Machine Learning Systems</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 260px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 131.15384615384616%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDAAUEBAUEAwUFBAUGBgUGCA4JCAcHCBEMDQoOFBEVFBMRExMWGB8bFhceFxMTGyUcHiAhIyMjFRomKSYiKR8iIyL/2wBDAQYGBggHCBAJCRAiFhMWIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiL/wAARCAA0ACgDASIAAhEBAxEB/8QAGwAAAQUBAQAAAAAAAAAAAAAAAAQFBgcIAQP/xAA3EAABAwIEBAMFBQkAAAAAAAABAgMEBREABhIhEyIxURQyQQcVYXGxCCM0coFCUlNic5GS0fD/xAAXAQADAQAAAAAAAAAAAAAAAAAAAQID/8QAHBEAAgMAAwEAAAAAAAAAAAAAAAECAxESITEi/9oADAMBAAIRAxEAPwDUj8gNzY8RidR2HfDodMaS3dwp35vMNtj6ehw5x3oSWSmW/T1PIJCyiyQCOo3J6Ai+IFmyD7xzFFiyMttVeC7DYU+ozXEqQE8Yg8JN76VFHMEk2Usb3ALKjLqXZbElnI8hpht9CzDMxekuEr5lgp8qRuNJIGrobkAG3qwt5tynPEBpUVRUdIA0m57YUeGY/gt/4DFTRqSxEfg1WNk2pwn6ctxLcZt5TheI0qTqNjy3Uo3/AJQNzy4k6825iUhwsZQk3Tcc79j0NttAv09DbcC/WwIlsmMx4R77lvyH9gdsGI1DzPPm1hdKn0R2EpUIyOKXCsWsNvKB62O97g2BG+DCYDVmWlxJdXhyXTLS4iK0lZYd0Ao1E2Nk7+qeYkWUqwBN8MbWXaG0eKI8xSSyGlNmWNJ2A1kBAF7737gdhazDSIc5uM/JbUpxDSUghxSbC3YHCWp1KjZNpLkuYvgMk2CNRUpxVtgkE9f+OB9Frjnh3KtNh02hgU119xh9fE++XqKTYJIvYdNP1xH6V7WMu1bNfuRkyW3nHC3HfWgcJ9W5ASQSRcJJTqAuNx1GK6zL7eZDjEiNQqayyl1CkIekLK1bjqEjYH5kjCT7NcxyoVXNZmMBbjPAdakkXKS6XOIjf4tpP6/AYiNim/l+FOtxWyXpoiT+De/Ir6YMEn8G9+RX0wYpmQRfwbH9NP0xkD2lZ0m5zzhJbhk+BjrLccr2QlItzfM9TbuOwxqavyJsbI8xykxXZVQMXRHZaIBU4oaUm56AEgk+gBxnepZAcy3lSm02uRoyZdVdDTtWmPa1x7c1kajZpOwQFd1C+xsM7VKSxGtTSeshEWj+Fktwgh96bKSW0KbaUpxS+bSEpAuByjbqdV+gBxqb2a5PRkrJ6GZKG26lMVx5igR5yNkX9dI27XuR1xV+XMjZnyHUHTRKE5KZnLReSJSC8g6QFAqJ8p0hQ3A1E9BbFz0+kyUKaXVJZcdtcN3w6oce2O2e4kPUggwniDcaFfTBgkW8E9ptbhm1vlgxbMRmj1Z8RWgEN7IHoe3zx5zJKKhHLE+JFkMkglt5vULg3Gx+IB/TBgwwFHvZ/wDca/sf94TSnmpymzMhxHy0boLjerSfhfp0wYMACdAjQUPuQqfCYcW2UFbTOk27benwwYMGEwP/2Q=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dmls\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg?w=65 65w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg?w=260 260w\"\n        sizes=\"(max-width: 260px) 100vw, 260px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>DMLS 책은 스탠포드 MLOps 강의로 유명한 Chip Huyen 교수님이 최근에 출판한 책입니다.<br>\n아직 한글판은 없어 Oreilly Learning 또는 Amazon에서 받아볼 수 있습니다.</p>\n<p><strong>좋았던 점</strong><br>\nFSDL보다 더 구체적인 사례를 들어 전반적인 내용을 이해하기 쉽게 설명한다고 느꼈습니다. 특히 구조적으로 설명해주고 바로 실무에 적용할 수 있도록 여러 가이드라인을 제시해주는 부분이 많습니다.<br>\n여러 오픈소스나 도구에 대해서도 기능을 구체적으로 다루기보다 어떤 기준으로 선택해야 하는지를 설명합니다. 실제 프로덕션 환경에서 마주치는 문제들을 소개하고 어떻게 해결하는지에 대한 내용을 미국 빅테크 기업들의 사례를 통해 설명하는 부분이 좋았습니다.</p>\n<p><strong>아쉬운 점</strong><br>\nMLOps와 데이터플랫폼의 역할을 완전히 나누어 두고 이건 우리의 역할이 아니라고 단정 짓는 부분들이 있습니다. 맞는 말이지만 어느 정도 같이 보고 싶은 분들에게는 아쉬울 수 있을 것 같습니다.</p>\n<br>\n<p>처음 시작한다면 접근성이 좋은 FSDL 강의를 보고 이후에 DMLS 책을 보는걸 추천드립니다.<br>\n특히 Data Distribution Shifts and Monitoring 목차는 FSDL을 먼저 확인한 다음 책을 보는게 이해하는데 도움이 되었습니다.</p>","excerpt":"MLOps…"}}}},{"node":{"title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","id":"1b2de017-d945-522e-be73-569bf48aea40","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}}}]}},"pageContext":{"basePath":"","paginationPath":"","pageNumber":0,"humanPageNumber":1,"skip":0,"limit":7,"numberOfPages":16,"previousPagePath":"","nextPagePath":"/2"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-posts-js","path":"/","result":{"data":{"allContentfulPost":{"edges":[{"node":{"title":"AI를 통해 변화하는 데이터플랫폼 근황","id":"3bc2c838-2281-5852-899f-ba16e366f41b","slug":"llm-dataplatform","publishDate":"January 21, 2024","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}}},{"node":{"title":"Pandas 2.0의 Copy-on-Write에 대하여","id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}}},{"node":{"title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}}},{"node":{"title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}}},{"node":{"title":"베를린에서 2개월 살아남기","id":"ab300765-6809-53b6-a6cd-952c7dd3c976","slug":"berlin","publishDate":"May 10, 2023","heroImage":{"title":"cover-personal","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&q=50&fm=webp 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&q=50&fm=webp 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&q=50&fm=webp 1400w","sizes":"(min-width: 1400px) 1400px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&fl=progressive&q=50&fm=jpg 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&fl=progressive&q=50&fm=jpg 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg 1400w","sizes":"(min-width: 1400px) 1400px, 100vw"}},"layout":"constrained","width":1800,"height":1062,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAAMABQDASIAAhEBAxEB/8QAFwABAQEBAAAAAAAAAAAAAAAAAAIDBv/EABoQAAIDAQEAAAAAAAAAAAAAAAMRAAECEiH/xAAVAQEBAAAAAAAAAAAAAAAAAAABA//EABURAQEAAAAAAAAAAAAAAAAAAAAR/9oADAMBAAIRAxEAPwDlAjvdNSiD5p35M8m2PbxaVKSQuy296alalC1EiIF//9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>우연히 회사에서 좋은 기회를 얻게 되어 독일에서 2개월 근무한 후기<br>\n베를린 생활부터 유럽의 개발 문화까지 그 동안 겪은 경험을 정리해보려 합니다.</p>\n<br>\n<h2 id=\"베를린-아파트\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EC%95%84%ED%8C%8C%ED%8A%B8\" aria-label=\"베를린 아파트 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 아파트</h2>\n<p>숙소가 정말 평이 좋고 실제로 시설도 좋은 아파트인데 엘리베이터가 없었다.\n여기는 그라운드 개념이 있어서 5층이 한국으로 치면 6층인데 다들 아무렇지 않게 걸어올라간다.\n빨래, 건조를 하려면 6층을 왕복 3번 다녀야 하는데 이게 제일 힘들었다.</p>\n<p>그리고 모든 문을 열쇠로 열어야 하는데 이게 정말 난감하다.\n최근에 열쇠를 들고 다녀본 기억이 없다보니 두고 다닐 수 있는데\n열쇠를 두고 오면 한화 약 20만원 정도의 벌금을 내야한다.\n열쇠 분실로 인한 사고 방지를 위해 문을 교체해버리기 때문에 저런 비용이 발생한다.\n개인적인 생각으로는 그냥 도어락을 도입하는게 나아보였다 🙏🏻</p>\n<br>\n<h2 id=\"베를린-교통과-생활\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EA%B5%90%ED%86%B5%EA%B3%BC-%EC%83%9D%ED%99%9C\" aria-label=\"베를린 교통과 생활 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 교통과 생활</h2>\n<p>처음 도착하자마자 놀란건 일요일에 모든 마트, 식료품가게가 문을 닫는다는 것이다.\n만약을 위해 베를린 전체에서 세 군데 정도 대형마트만 문을 연다.\n결국 생활용품을 사기 위해 베를린 중앙역까지 갔는데 뉴스에서만 보던 그림을 볼 수 있었다.\n재난상황마냥 줄이 끝까지 이어져있고 마트 내부 물품은 다 털려있었다.\n그래도 독일은 국가가 통제하기 때문에 마트 물가가 정말 저렴하다.</p>\n<p>베를린 대중교통으로는 트램, 지하철, 버스를 제일 많이 탄다.\n종일권을 끊으면 모든 교통수단을 무제한으로 탈 수 있다.\n근데 이 보다 더 좋은 교통수단은 자전거다.\n자전거 도로가 너무 잘되어 있어서 대중교통 이용하는 것보다 시간이 빠를 때가 많다.\n도시 간 이동으로는 flixbus와 ICE 고속열차를 많이 이용한다.\n독일의 고속철은 워낙 악명 높아서 취소되는 일이 빈번하다 들었는데\n역시나 당일 오전 출발 5분 전에 ICE 열차 취소를 겪었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 37.53753753753754%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAPCAIAAAAZNRq0AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAABjpJREFUGBkFwclvHWcBAPBvvu+bfebN2+3nF+92EjuJ4yxt1UBSSumBQiVAVAKhHoALJ/4Gzty4VOIKSAj1gAQFoTaUUBK6KDR1XhI7jpfnZ/tt87aZ8azfxu8n/ea994CEHz5rvPPdt+5+9Pfc7JRt5DQ59+9PPpla3nCqFd1SjTQCKPP8aMFRmVY488Kz8ah90t1r9yLfRzxDlBAuYdWy6yuJPyisbEBVB0ACgkNJqFbBsR3dzutWnhL6wW9/rQmGwyQOwrhYcdrdY0Vz+t1EW5wyZfXyrVcKBQcAhJJQl9HRUWfoTnaHg27nGENSr+aK9TlNwSlns4sroyAUw757epwysfK1N7XidBiGgpHza5eKtXOMMIRkDCGEKMvSnOMwb4gVRZnJF563DiTVsCqVcsGuFy0R00F7dLi7F3je0O0urq6/aD576dbVixvrC8tvcSbFoY/t5d5f7xfqS1kQVhfmU8uuL612g3R1bXU8OXOs8uqlSxCpCEKKmeBCkbEEJJZSXcPuiYfbzX2OdAZSCybCGx02vrjXn1xYW9/Z3Zqbr9emjZevXoHmufx8fvnCatQZ9E7iYSApetWKWXXpCmM0HXUK52+OHn+cU3iIk1K5uLZ5nRLqjbx82c6yTMcSQjKjFGMZaxIksSIjjEROywZ+++gfrYObt+5sXrjlEkXF1u3XXgGC9/udiAga8OfH1QeNYcVCjkx3E/nSOTE/rbY//aOuayUbxXsCcWZbts1UW5NNxOIkq+RUzBJNQUIIwYmiYxnDVEKWba6/fgdfuHqRhqNBTJZny7ff+M7RUXOq/3TkD6OJmgJFMCwIkZCMLBmztHcWYBw7lAQt6WCgdFsntm0uvv7mchUfnp4xFhgSnAJRLn66VFjyvLhU1LM0ev8Pf37nx99XFGXvxc7dD+939nqJO8YvGo9yC5v1zW+PDx+2d7ZTAIi+kLiHlflp6p4UrErkEUs3jK2PZ6FfzikykkOR03OqMNDdo/3DNGvtv/j5uz+cKVUePe9CTrbu/qXVGcscFAsalFEcJ+2j8T0H/+7375/FPkuTvFPaORxJv/jlr85bhnPtxs4//5QwdaM05Zq5Z82hYYqUiEU7/N+OO1s1L0/N+P3jvVGXI3W75d15ed4NNEz9ZnfonR4dj7yLF9dWr726s71rWVYYRuVSKQzPsKJRQkAcjfzR9pOGAADxjFCCOEBf/+aP2l+2gjhw3bbnTZqDyeP9fhx6p83DUXfy9m3rSd85g3a373YG/o4bQafWm5COJ/UGbaDl7yyeu7G8SmuVxqNG6+jULk5326eAU8BIGoVrwejG6vqrP/jJaaf1fPspt6fTLBGcUZoh03A8aAYs0HigabqXZI0nDwmj1zaXdvd3HzwZu24v9nqKIscSm7JRY3v/5Gi3WCgszOUef3b/YOA2esMsSlVN1zRrNBraOadQKmd+b/b6G/Pf+2kys/Lwwd0vP/2Xp1czhkDqyyxmXEBHrS9U5077vf3OsJ/AEOpY0SYT779bbrFUKdXmE8KRJBmmYeja29+4TEjCGH2x04DQquo0mXR7B8/c9olsV4IzX5JAvliu1FcufutnWnGuubu//Z+/dZvbIUc46CmDhkx9IEEIJVyyEij3Zeo32y5zliw7VyhXRmcaAIgxJquqpcJabdq2dIDze8e9mbxCSdHWZX84GBCNZAkwSmbt/KDdgrK2duUlq1jjQozbTc65o/KKBeaubUwyEQdeLGky5CyL6/UFPPb6Js8URZ2aqiIIJCAopWk0tnMmVBSeTGrTJU4TSlQZSh980d64tPHu9ZulQunDex9tb32ODSdfW5Fosrx6pViuSYqRpkk0GZLI1xCL5NSNU920Zgz2LMs4SYUqSwhTSnA90a+n1mc5tgf5JEnytlktFyXoF3JM102WxkgCksAZpSO/m9f43Ny8bhUyIcVJgkxnZvGKYVhQNrBsEChnwdgbdrMo0FkiFPb53j6holYpBV6vXqnsUpnHXRnh/tDF60Nqm5lqcqzpc4XywvnLB1+NuQRN01AxYhAQSgXCUUYpgERCcUqiKEQyplm2vvma4CAhXBKQEDI63ovGfUASQFMgMqLgie/LED7Z6dm6rKZETYngCRUYAPB/NzaH9Z6KIwIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7tkv507AwrYFuJTU3i2nDp/07156583959a4a15218927af8cf27f8b/berlin1.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오전 ICE 전체 지연으로 베를린 중앙역이 전쟁터가 된 모습, 환불을 받기 위해 전부 줄서있는 모습</p>\n<p>6시간 연착이라고 당당하게 설명하는데 사람들이 너무 당연하게 받아들여서 당황했다.<br>\n근데 더 놀라운 것은 환불 절차다.\n한국은 유럽과 같은 은행코드를 사용하지 않아 앱에서 환불 받을 수 없었다.\n방법은 DB 본사에 우편으로 직접 적어서 보내는 것 밖에 없다. 당연히 이메일도 불가능했다.</p>\n<br>\n<h2 id=\"베를린-음식\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EC%9D%8C%EC%8B%9D\" aria-label=\"베를린 음식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 음식</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 37.53753753753754%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAPACgDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAcDBggE/8QAKhAAAgIBAwMCBQUAAAAAAAAAAQIDBBEFEiEABgcUQRMiMVFxCBUyM5H/xAAXAQADAQAAAAAAAAAAAAAAAAABAgYH/8QAJREAAQMDAwMFAAAAAAAAAAAAAQIDEQAEIQUSMUFRYXGR4fDx/9oADAMBAAIRAxEAPwBad4eZrXY96XSamnpeSrEI3ZpsOHaNjkL7hdyn8j/L/S1nV56GkrdpGV78QxMFYLECx3SbTjdhD+M45yMGk+dP006v213ZZ1OXUCiz5sNNGElQbiU+UHaw/rxjn6dRLqs0ENSvsns1aldY64s6izFZQMliPhEncx5y38eAMcGXv7fVEylgFJmcEce/7Wm2txpbjCXDChHP3rXNe7dn1XyxpP716GdZoI5JmijWcQpXZd0Qc5Cb2sAH3G336Z3kLXZa1Onclodv2UoCWaO2+myfErrhd4RxIcHGFYr9OOOcdJHzXr3dHiSKlW0+w0mq6nJPM0sVorJAyOrkK+0KclxkbQDtH24TE/mfV7GgvZu3LGrNNGVb1FmTflhyxY55BAPvyo+w6V7Tb65fSp1UQBuGM4EnxPEDtUW7eWyNwaTukmDxAnA81pMd214NYo6pc7S0a9p2/bdt6dpqC7CHjBWwr8uwUuu4qSRyQDyejrK2hdx6u8cST339OsW8x4+Z190Z1wSMEjn2GPpjo6CtDcbOx5zI7Tx0n4oG/t1Hc0ggH058V//Z'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/6WNcaebJi7ygKMVfIyNVOZ/e4d6a0a5168f5328876276f3b78a324f/berlin2.jpeg?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>베를린은 너무 다양한 인종이 살고 있어 전 세계 음식을 다 먹어볼 수 있다.<br>\n그 중에서 독일 음식은 흰색 소세지와 커리부어스트만 먹어보면 된다. 나머지는 별로였다.\n햄버거의 어원이 함부르크에서 나온 만큼 수제버거도 맛있는 곳이 많다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 37.53753753753754%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAPACgDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAABgcAAQQF/8QAJxAAAgEDBAICAgMBAAAAAAAAAQIDBAURAAYSIRMxBxQjMiIzQVH/xAAWAQEBAQAAAAAAAAAAAAAAAAAGBAX/xAAkEQABAwMDBAMAAAAAAAAAAAABAgMEABEhBRJhMXGRsVGBof/aAAwDAQACEQMRAD8ASG1dt3m1VDbmeBrBI6GlnuH5HE8jRsGSGLH8iVBUvjiM9nTN21S7XuFprp6yhpXmWEvGtbVSR1DHjyLo4jEZzyU8CAfeM+tXvO23K3bjiv0V2krHpofG9BN1H4wCMIe+PRxjvP8A0aWN73zQT/Z8VsejgqiuIRJ+BDkEsIx0D79DRXS340uIlMhaR8g3uOxOfGLYpNqDEpqUpyO2q5yCnAPe2Ps5vmiK2/F20NzV0ldeYKi4/SieNLfAQ0Rlk/UuofyN/W2AvvPsY7211o2VYLFV3jam06aga3oppLnTUhnkikZQQJULthXYkAhlI5DphnQX8Zbghq7pfp1X7TYp0Zy7wnIDk8SpBAz/AIc+h7wDrsXquncv4KSioaEyLJJDQwhHlKkFS0hJY4IBwOIJ9gnvRmZKQ3PW2hVkDAHHUe6Rx4b70NCnE3cIuTz781dm+UFtcyQ7h2lHZrZNEi/c+mgj5kAc3cEhVZvXWO/YxnU0L3vhuGFkKT3CSR2861NSyxYKgLkgcsDH64bo4z1qajMSG4dy17Dwf3NaTUqekWDe7kiv/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/NBW0iiM0Jv7HJ6ktoRiQT/3deaafa12c7e9b4de138e73f090a7823/berlin3.jpg?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>보통 해외에서 새벽에 다니면 위험한 경우가 많은데 베를린은 서울보다 더 밤새도록 노는 도시라 정말 안전하다.<br>\n오이스터 바에 가면 비싼 돈을 주고 굴을 먹을 수 있는데 비린내가 안나고 우유 맛이 난다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.030739673390975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAATACgDASIAAhEBAxEB/8QAGAAAAwEBAAAAAAAAAAAAAAAAAAYHBQj/xAApEAABBAEDAwQCAwEAAAAAAAABAgMEEQUABiEHEjETFCJBQlFhgZHB/8QAGQEAAgMBAAAAAAAAAAAAAAAAAgMBBAYF/8QAIREAAgICAQQDAAAAAAAAAAAAAQIAEQMhBEFRYaEFEhP/2gAMAwEAAhEDEQA/AI217VEcFx1KBVUVdtnS11NbLew8gPYONNSWT6T6kEJcpQvtP3X8aVZW+ME9LjPvPBVJBUlCnkAnsAoEpock/WtXcHULG5XZrePGRXOfSwlDLae8rZUAnuSlJB4+IPkWSTVknSm+VU5PzKGj1o+a91La8CsRyFhY6a8X6uRqFsSbkoRlxozjjIQtYCB6h+NdxNDgc3z9A6ZsT0tjTtoY/JqS+qY9l0QltpICfSKfPjg3xfjT9s5nP56FOXC2+jHYptCBJn5t0Q2G+9IpVCiU/l8Qb4u70z7Y3BFhY+Z72W5kttxVhU/JJaMaGgpICUNLUlTri+eBaAb5Fc6S+f6qbO+0SqAkSG7x6bvxNzZOFjse60zHV8GXF2pKbrkmrPB0apfV3qw5nNhRc5Exj8MzJr6Y7jjoV2gVffQvxRCSo8q7rpQBNRjzM66hOiKZCJiitACiSKUP8ST/AMGs7Fvue4RaibNc86NGmUITmVPbWam53L46NOfMiLCkRm48cgBpAtP4AAE8nki9dL9R0Ji9J8NAbQkQlNKdVHKQUFRUuyQfJ4/rn9nRo1nuZorXeWeLstc4Kym4cnKjyMW7kJLmNYecW1DU6fSbUVAEpT4HAHj9DRo0a0igAanOJuf/2Q=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg?w=521 521w,\nhttps://images.ctfassets.net/tushy4jlcik7/4uTmvrpsUVq0ngO7erPnZ2/934ea3293d5f1d3cdb31a59b2545e9a2/berlin4.jpg?w=1041 1041w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>때마침 베를린 빛 축제가 진행 중이어서 관광지에서 다양한 야경을 볼 수 있었다.</p>\n<br>\n<h2 id=\"베를린-개발-문화-스타트업\" style=\"position:relative;\"><a href=\"#%EB%B2%A0%EB%A5%BC%EB%A6%B0-%EA%B0%9C%EB%B0%9C-%EB%AC%B8%ED%99%94-%EC%8A%A4%ED%83%80%ED%8A%B8%EC%97%85\" aria-label=\"베를린 개발 문화 스타트업 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>베를린 개발 문화, 스타트업</h2>\n<p>유럽도 일하는 방식은 비슷했으나 한국과 비교했을 때 일을 디테일하게 한다고 느꼈다.\n예를 들면 RFC 문서를 정말 자세히 작성하고 오픈소스와 같은 플랫폼 운영 방식을 가지고 있었다.</p>\n<p>그리고 정서 상 한국은 정말 겸손한 반면 여기는 잘한 일이 생기면 자랑하고 모두가 축하하는 분위기였다.\n해외 감성으로 네트워킹, 파티도 자주 열린다.\n독일은 아프면 바로 병가를 15일까지 낼 수 있고 휴가가 25일이다.</p>\n<p>금요일에는 모두 일찍 퇴근하고 앞에서 맥주를 마신다.\n모든 과정을 경험해보니 절대 한국만큼의 개발 속도가 나올 수는 없겠다는 생각이 들었지만\n반대로 유럽에서 여유롭게 사는 법을 배운 것 같다.</p>\n<p>데이터 분야에서는 특별한 차이가 있는데 개인정보에 대한 사람들의 인식이다.\n한국에 있을 때도 많이 들어봤던 GDPR이라는 규정에 대해서도 알게 되었다.\n대부분 사용자들은 개인정보를 절대 서비스에 넘기려하지 않는다.</p>\n<p>그러다보니 데이터 기반의 서비스를 만드는 사람들은 정말 난감할 때가 많은데 개인화 추천이 가장 대표적이다.\n일단 사용자를 식별해야 개인화를 할텐데 여기는 개인을 정의하는 것부터가 어려운 문제다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 75%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAeACgDASIAAhEBAxEB/8QAGgAAAgIDAAAAAAAAAAAAAAAABgcABQMECP/EADAQAAIBAwIEBAUDBQAAAAAAAAECAwQFEQAhBgcSExQVMUEIIlFhcSMysUJygZHw/8QAGAEAAwEBAAAAAAAAAAAAAAAAAwYHBAD/xAAqEQABBAECBAQHAAAAAAAAAAABAgMEEQAFQSFRYXESMYHwExQicrHB8f/aAAwDAQACEQMRAD8A6bMakhd/sDrYprcZGyoBPruRrJWRRUVrq69yJVpomlZQekHpBOM7+uNLG/8AxN8O2KkZrZQ1V2kI+UtiGM/cE7kf4GiydTiRSA6uj75YCPp8qULbTY97nAznNxzd6Dm5Q2KGpaOjTwc6wxkL85kOc4GXHyrsTj7b6b0l/Wr4co1lhQyvGsg6dsEgHXJvMLjur4z4nqeIzTRUtf5e0kDRlv0+30lCBnOcn1/jV1ceaPENoqeVtBHXsLbXww+KBVS85KLgM5Bb+r676TImvJjag4++VFtd+EfbZ58Ppv8AGN8jRFyYaGWAkLTVnuADtx44/wCCrQu6BimBufU51NAF44/sdhofE1FwdGeOSQwpC7yAIMuCADuBv+NTVERqEKSkOtvpII5j2PXEMwZzBLa2FWOhzJzL+IaovtlrOG7bDNDHJIFeuJAaWMOCY+jAK9QVgTk+59MZSNUzVMxhmKKZBgIDsB9AMH/hpbLzAvnbEjPSp2sxKY4AWwAFG7ZJOFAznOq2180XgvVT5jSR1ywoGjkKYZTkZ2yP51HJEWdJV8R4glI2/gGVWOqKyPBH4Ane8M6+vFFboxPMobwFYhCgsMpLEvsQPcas7nW+YcOcJ100pglswo6mjfAKzIBH3kY5ypXKEHBBHUNA1dxtbakJH5FEEdpRlZCrdLOrMPQ+vSD+RrXruJZbjY6S1mkENFFH2VAqOpgO2d/2DJzj/QPtg98m66EkpqiTt5G+vp2zSHQ0TS7uvK9q6YZ3vmfa7nekavBo2pLkYioQuHgkV4Sds5x3Mn+0Y1NJbjm6W+xR+JqI6tpapm6exIoC4UvncfVRqa1p0BpxIKFKSByI/YPXAuau42ohYBPbP//Z'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"berlin5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg?w=1008 1008w,\nhttps://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg?w=2016 2016w,\nhttps://images.ctfassets.net/tushy4jlcik7/1NADsKQpq4RjGXLw4PeDxX/04875f6cf3c88cd306275b664c8daad2/berlin5.jpg?w=4032 4032w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>베를린의 옛 건물을 내부만 리모델링해서 사용한 스타트업 공유 오피스도 방문했었다.<br>\n자동차 회사가 많은 나라답게 다양한 모빌리티 스타트업을 만날 수 있었다.<br>\n베를린에는 유럽 내의 스타트업이 많은 편인데 이 도시가 유럽에서 가장 글로벌하기 때문이다.<br>\n시골로 내려가면 기술에 대한 거부반응을 가진 사람이 많은 반면 베를린은 해외에서 온 이민자가 많다.\n그래서 독일어가 있음에도 영어를 정말 많이 사용한다.</p>\n<p>개발자 한정 2년만 근무하면 시민권도 쉽게 얻을 수 있다.\n대신 세금으로 절반을 가져간다 💸<br>\n이 말을 듣고 한국에서 살아야겠다는 생각이 들었다.</p>\n<p>인터넷이 정말 느려서 불편하다고 생각했는데 이 정도면 유럽에서 엄청 빠른 편이라고 한다.<br>\n하지만 스웨덴 스톡홀름에 가보니 독일 인터넷이 느리다는걸 확신할 수 있었다.</p>\n<br>\n<p>어쨋든 무사히 돌아와서 다행이라는 생각이 들었다.\n영어로 일하고 회의하는 것은 정말 많은 노력이 필요했다.<br>\n대신 유럽에서 근무하면 주말 동안 주변 국가 여행할 수 있다는 점이 큰 장점이다.<br>\n요즘 재택이 많아지다보니 해외에서 근무 가능한 회사들도 많이 생기고 있는데<br>\n만약 유럽에서 살고 싶다면 베를린에서 살아보는 것도 괜찮은 것 같다.</p>\n<br>","excerpt":"우연히 회사에서 좋은 기회를 얻게 되어 독일에서…"}}}},{"node":{"title":"MLOps 관련 책, 강의 리뷰 (DMLS, FSDL)","id":"8a70bf4b-6469-516d-9b3f-43f3fa109774","slug":"mlops-dmls-fsdl","publishDate":"September 13, 2022","heroImage":{"title":"cover-personal","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&q=50&fm=webp 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&q=50&fm=webp 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&q=50&fm=webp 1400w","sizes":"(min-width: 1400px) 1400px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=350&h=207&fl=progressive&q=50&fm=jpg 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=700&h=413&fl=progressive&q=50&fm=jpg 700w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1400&h=826&fl=progressive&q=50&fm=jpg 1400w","sizes":"(min-width: 1400px) 1400px, 100vw"}},"layout":"constrained","width":1800,"height":1062,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAAMABQDASIAAhEBAxEB/8QAFwABAQEBAAAAAAAAAAAAAAAAAAIDBv/EABoQAAIDAQEAAAAAAAAAAAAAAAMRAAECEiH/xAAVAQEBAAAAAAAAAAAAAAAAAAABA//EABURAQEAAAAAAAAAAAAAAAAAAAAR/9oADAMBAAIRAxEAPwDlAjvdNSiD5p35M8m2PbxaVKSQuy296alalC1EiIF//9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/3ltdJp06NzCExAWz9OF8Ak/d8ca530c80e7c79a7bd7e4c396c0ae00/cover_personal.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>MLOps는 다양한 지식과 컴포넌트를 다루고 있어 따로 공부하다보면 중요한 부분을 놓치고 도구에만 집착하게 되는 경우도 많습니다. 반면 알려진 책이나 강의를 들으니 퍼즐 조각들이 맞춰지는 것처럼 흩어져 있는 지식들이 하나로 정리되는 느낌을 받을 수 있었습니다.</p>\n<p>이 글에서는 MLOps 관련 자료 중 유명한 <strong>Full Stack Deep Learning</strong> 강의와 <strong>Designing Machine Learning Systems</strong> 책을 리뷰해보려 합니다.\nMLOps에 대해 관심있거나 시작하기 위해 자료를 찾는 분들에게 도움이 될 수 있을 것 같습니다.</p>\n<br>\n<h2 id=\"full-stack-deep-learning\" style=\"position:relative;\"><a href=\"#full-stack-deep-learning\" aria-label=\"full stack deep learning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Full Stack Deep Learning</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.41630901287554%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAqlQTFRFQVStcGiQRVivXGy4V2i2Xm65VGS1W2u4RlivQFOtQlStZ3a9RlSZOkiOQE6ROEeNM0KKPlCnVme2V2e2UGGzVWa1SlyxQVSvVWOtQlWwSFuyS12zSVuyTF6zTF60RVexT2G1OkucPU2cPU6cOkqaOUmZQFKrR1qySl2zSlyzQ1WwVGW3RlmxRVixT2C1TV+0QVSwQ1WzRFe3RVi7Rlq/dILOYXLIZnfKd4XPbHvMX3DHaHjKZnbKanrLXm/HYHHHUWTDW2GtbWieaGajTVy4R1vDf43Vk5/ccoHRipfZj5vakZ3bcIDQiZbYmqXeaHnObmmhwYRT0YlB7bVn5qVU04lAoHlxTV29SFzGVmnLSV7HSl7HSl/HUmXJSV3HT1/B3JFFz4U8zolD775w4adbzoQ835A9mnp+SV7Kj5vep7HmsbrolaHhpa/lpK7lf47aWGS/3I8/zII81Yk91Ig84pI+rIN1Sl/OU2jRUmfQlZvH6qFH55tD5JU+5JQ+3JA/2ZJD1Kl8YHPQS2HSTGLSZXfYXnLXYHTXY3bYYXTXZXjYYnXXXnHXZHfYZ3nZZnnZWW3VXnLTz9LQ6Z5F6qJI66NI6J9G3pRC37aCpLDYTGPWW3DZU2nYVGrYU2nXV23YVmzYVWvYVmvYUmjXXnLRzNTZ2raN6aFI3JtU0czDoq7RTmXaaHvfYHXeaHzfaX3gan7gZHjfZ3vfZnrfYXbeTmXZlZ6+ytLX0czE2LmX2rKF2bSK1cGoz9TWvcTJZ3jKT2beUWneW3HgVm3fUWjbdIHAoai6trzAvMLGusDEsLW8jZe6X3HNUGjiW3LjUWjibYHmZ3zla3/mcYTnaH3mWXDjXHLkUGjhVmzaXHDUWm/WUmnfUWnlVm7mXXTnW3LnUmvpU2ztVG7xxYsqCgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAADbSURBVBgZjcELTsJAFEDRe8MToYIVhLAN978jNUEDGPyExplO+SXG9BxRMUE5swBsbWNlcSA+uTA2A0w2ta4WvjHXwyv/8ol+QvoJ6Sekn5CWF3Z0puo7RcxomWByCG9o3ZnNXZPFIy2zZvBNMia79YgsHmhZfHEyMmm2tZJFzZmOOBmYMNXJB0lMyDz7GeIW7n1eKSYvJLGiZefQDKGpoHLhGpqFShIzWh7tSSqo1LkFSSzJlMIJnbCzW5LElMyiGbjnpDLZMCWLmkwpHHKtpojgWvC3kH5C+vkFpuwhkVffvwIAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADIzMzD8QLLwAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTk4oL5yIAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"fsdl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png?w=583 583w,\nhttps://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png?w=1165 1165w,\nhttps://images.ctfassets.net/tushy4jlcik7/283csicsJ5LF2Agl9rlM7E/ea32c80ba87a68b8cea7f4c84375ed7d/fsdl.png?w=2330 2330w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>FSDL 강의는 MLOps 전반적인 주제를 모두 다루는 온라인 강의입니다.<br>\n아래 사이트 또는 유튜브에서 최신 강의를 볼 수 있습니다.<br>\n링크: <a href=\"https://fullstackdeeplearning.com/\">https://fullstackdeeplearning.com/</a></p>\n<p><strong>좋았던 점</strong><br>\n매년 강의의 내용이 최신 트렌드를 최대한 반영하기 위해 업데이트 되고 있으며 Lab이라는 실습 과정이 준비되어 있습니다. CoLab 환경에서 실습할 수 있도록 자료가 준비되어 있는데 특히 ML 테스트 챕터의 자료가 좋았습니다.<br>\n중간에 다양한 오픈소스나 도구들을 소개해주는데 직접 구축하는 경우에도 아이디어를 얻을 수 있어 유용했습니다.</p>\n<p><strong>아쉬운 점</strong><br>\n많은 내용을 다루다보니 특정 주제는 간단하게 이미지나 링크만 공유하고 넘어가는 경우가 있어 설명이 부족한 경우가 있습니다. 제대로 이해하려면 제공되는 학습 자료들을 모두 찾아서 봐야 했습니다.<br>\n절대 사용할 일이 없을 법한 초기 스타트업들의 SaaS를 소개할때가 있는데 광고를 받은게 아닌가 싶은 생각이 들었습니다.</p>\n<br>\n<h2 id=\"designing-machine-learning-systems\" style=\"position:relative;\"><a href=\"#designing-machine-learning-systems\" aria-label=\"designing machine learning systems permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Designing Machine Learning Systems</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 260px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 131.15384615384616%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDAAUEBAUEAwUFBAUGBgUGCA4JCAcHCBEMDQoOFBEVFBMRExMWGB8bFhceFxMTGyUcHiAhIyMjFRomKSYiKR8iIyL/2wBDAQYGBggHCBAJCRAiFhMWIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiIiL/wAARCAA0ACgDASIAAhEBAxEB/8QAGwAAAQUBAQAAAAAAAAAAAAAAAAQFBgcIAQP/xAA3EAABAwIEBAMFBQkAAAAAAAABAgMEBREABhIhEyIxURQyQQcVYXGxCCM0coFCUlNic5GS0fD/xAAXAQADAQAAAAAAAAAAAAAAAAAAAQID/8QAHBEAAgMAAwEAAAAAAAAAAAAAAAECAxESITEi/9oADAMBAAIRAxEAPwDUj8gNzY8RidR2HfDodMaS3dwp35vMNtj6ehw5x3oSWSmW/T1PIJCyiyQCOo3J6Ai+IFmyD7xzFFiyMttVeC7DYU+ozXEqQE8Yg8JN76VFHMEk2Usb3ALKjLqXZbElnI8hpht9CzDMxekuEr5lgp8qRuNJIGrobkAG3qwt5tynPEBpUVRUdIA0m57YUeGY/gt/4DFTRqSxEfg1WNk2pwn6ctxLcZt5TheI0qTqNjy3Uo3/AJQNzy4k6825iUhwsZQk3Tcc79j0NttAv09DbcC/WwIlsmMx4R77lvyH9gdsGI1DzPPm1hdKn0R2EpUIyOKXCsWsNvKB62O97g2BG+DCYDVmWlxJdXhyXTLS4iK0lZYd0Ao1E2Nk7+qeYkWUqwBN8MbWXaG0eKI8xSSyGlNmWNJ2A1kBAF7737gdhazDSIc5uM/JbUpxDSUghxSbC3YHCWp1KjZNpLkuYvgMk2CNRUpxVtgkE9f+OB9Frjnh3KtNh02hgU119xh9fE++XqKTYJIvYdNP1xH6V7WMu1bNfuRkyW3nHC3HfWgcJ9W5ASQSRcJJTqAuNx1GK6zL7eZDjEiNQqayyl1CkIekLK1bjqEjYH5kjCT7NcxyoVXNZmMBbjPAdakkXKS6XOIjf4tpP6/AYiNim/l+FOtxWyXpoiT+De/Ir6YMEn8G9+RX0wYpmQRfwbH9NP0xkD2lZ0m5zzhJbhk+BjrLccr2QlItzfM9TbuOwxqavyJsbI8xykxXZVQMXRHZaIBU4oaUm56AEgk+gBxnepZAcy3lSm02uRoyZdVdDTtWmPa1x7c1kajZpOwQFd1C+xsM7VKSxGtTSeshEWj+Fktwgh96bKSW0KbaUpxS+bSEpAuByjbqdV+gBxqb2a5PRkrJ6GZKG26lMVx5igR5yNkX9dI27XuR1xV+XMjZnyHUHTRKE5KZnLReSJSC8g6QFAqJ8p0hQ3A1E9BbFz0+kyUKaXVJZcdtcN3w6oce2O2e4kPUggwniDcaFfTBgkW8E9ptbhm1vlgxbMRmj1Z8RWgEN7IHoe3zx5zJKKhHLE+JFkMkglt5vULg3Gx+IB/TBgwwFHvZ/wDca/sf94TSnmpymzMhxHy0boLjerSfhfp0wYMACdAjQUPuQqfCYcW2UFbTOk27benwwYMGEwP/2Q=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dmls\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg?w=65 65w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Ck054YBKSsh0Q0pMVqWSq/a94f7d3537af51d760382c9b6963c954/dmls.jpg?w=260 260w\"\n        sizes=\"(max-width: 260px) 100vw, 260px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>DMLS 책은 스탠포드 MLOps 강의로 유명한 Chip Huyen 교수님이 최근에 출판한 책입니다.<br>\n아직 한글판은 없어 Oreilly Learning 또는 Amazon에서 받아볼 수 있습니다.</p>\n<p><strong>좋았던 점</strong><br>\nFSDL보다 더 구체적인 사례를 들어 전반적인 내용을 이해하기 쉽게 설명한다고 느꼈습니다. 특히 구조적으로 설명해주고 바로 실무에 적용할 수 있도록 여러 가이드라인을 제시해주는 부분이 많습니다.<br>\n여러 오픈소스나 도구에 대해서도 기능을 구체적으로 다루기보다 어떤 기준으로 선택해야 하는지를 설명합니다. 실제 프로덕션 환경에서 마주치는 문제들을 소개하고 어떻게 해결하는지에 대한 내용을 미국 빅테크 기업들의 사례를 통해 설명하는 부분이 좋았습니다.</p>\n<p><strong>아쉬운 점</strong><br>\nMLOps와 데이터플랫폼의 역할을 완전히 나누어 두고 이건 우리의 역할이 아니라고 단정 짓는 부분들이 있습니다. 맞는 말이지만 어느 정도 같이 보고 싶은 분들에게는 아쉬울 수 있을 것 같습니다.</p>\n<br>\n<p>처음 시작한다면 접근성이 좋은 FSDL 강의를 보고 이후에 DMLS 책을 보는걸 추천드립니다.<br>\n특히 Data Distribution Shifts and Monitoring 목차는 FSDL을 먼저 확인한 다음 책을 보는게 이해하는데 도움이 되었습니다.</p>","excerpt":"MLOps…"}}}},{"node":{"title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","id":"1b2de017-d945-522e-be73-569bf48aea40","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}}}]}},"pageContext":{"basePath":"","paginationPath":"","pageNumber":0,"humanPageNumber":1,"skip":0,"limit":7,"numberOfPages":16,"previousPagePath":"","nextPagePath":"/2"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/llm-dataplatform/page-data.json b/page-data/llm-dataplatform/page-data.json
index b2e3f5a..b8583fa 100644
--- a/page-data/llm-dataplatform/page-data.json
+++ b/page-data/llm-dataplatform/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-post-js","path":"/llm-dataplatform/","result":{"data":{"contentfulPost":{"title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","metaDescription":null,"publishDate":"January 21, 2024","publishDateISO":"2024-01-21","tags":[{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering"}],"heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"}}}},"pageContext":{"slug":"llm-dataplatform","basePath":"","prev":null,"next":{"slug":"pandas-2-0-copy-on-write","publishDate":"2023-12-24"}}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-post-js","path":"/llm-dataplatform/","result":{"data":{"contentfulPost":{"title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","metaDescription":null,"publishDate":"January 21, 2024","publishDateISO":"2024-01-21","tags":[{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering"}],"heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다. 자연어를 SQL로 변환 (Text2SQL, SQL2Text) 지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 , 와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 Text2SQL, SQL2Text 기술이라고 볼 수 있습니다. Text2SQL…"}}}},"pageContext":{"slug":"llm-dataplatform","basePath":"","prev":null,"next":{"slug":"pandas-2-0-copy-on-write","publishDate":"2023-12-24"}}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/tag/dataengineering/2/page-data.json b/page-data/tag/dataengineering/2/page-data.json
index ccca579..29df849 100644
--- a/page-data/tag/dataengineering/2/page-data.json
+++ b/page-data/tag/dataengineering/2/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/2","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":1,"humanPageNumber":2,"skip":6,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering","nextPagePath":"/tag/dataengineering/3"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/2","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":1,"humanPageNumber":2,"skip":6,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering","nextPagePath":"/tag/dataengineering/3"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/tag/dataengineering/3/page-data.json b/page-data/tag/dataengineering/3/page-data.json
index 6479c51..99a10d2 100644
--- a/page-data/tag/dataengineering/3/page-data.json
+++ b/page-data/tag/dataengineering/3/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/3","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":2,"humanPageNumber":3,"skip":12,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/2","nextPagePath":"/tag/dataengineering/4"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/3","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":2,"humanPageNumber":3,"skip":12,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/2","nextPagePath":"/tag/dataengineering/4"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/tag/dataengineering/4/page-data.json b/page-data/tag/dataengineering/4/page-data.json
index f909810..9a45380 100644
--- a/page-data/tag/dataengineering/4/page-data.json
+++ b/page-data/tag/dataengineering/4/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/4","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":3,"humanPageNumber":4,"skip":18,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/3","nextPagePath":"/tag/dataengineering/5"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/4","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":3,"humanPageNumber":4,"skip":18,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/3","nextPagePath":"/tag/dataengineering/5"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/tag/dataengineering/5/page-data.json b/page-data/tag/dataengineering/5/page-data.json
index fc92b4d..bd58158 100644
--- a/page-data/tag/dataengineering/5/page-data.json
+++ b/page-data/tag/dataengineering/5/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/5","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":4,"humanPageNumber":5,"skip":24,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/4","nextPagePath":"/tag/dataengineering/6"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/5","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":4,"humanPageNumber":5,"skip":24,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/4","nextPagePath":"/tag/dataengineering/6"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/tag/dataengineering/6/page-data.json b/page-data/tag/dataengineering/6/page-data.json
index 74fbf3c..1718a86 100644
--- a/page-data/tag/dataengineering/6/page-data.json
+++ b/page-data/tag/dataengineering/6/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/6","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":5,"humanPageNumber":6,"skip":30,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/5","nextPagePath":"/tag/dataengineering/7"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/6","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":5,"humanPageNumber":6,"skip":30,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/5","nextPagePath":"/tag/dataengineering/7"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/tag/dataengineering/7/page-data.json b/page-data/tag/dataengineering/7/page-data.json
index 16e0dac..5f791dd 100644
--- a/page-data/tag/dataengineering/7/page-data.json
+++ b/page-data/tag/dataengineering/7/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/7","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":6,"humanPageNumber":7,"skip":36,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/6","nextPagePath":""}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering/7","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":6,"humanPageNumber":7,"skip":36,"limit":6,"numberOfPages":7,"previousPagePath":"/tag/dataengineering/6","nextPagePath":""}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/page-data/tag/dataengineering/page-data.json b/page-data/tag/dataengineering/page-data.json
index 0378951..f64330f 100644
--- a/page-data/tag/dataengineering/page-data.json
+++ b/page-data/tag/dataengineering/page-data.json
@@ -1 +1 @@
-{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 진화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 Databrics, Snowflake와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 주어진 자연어로부터 쿼리문을 생성하는 것을 말합니다. 쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n</code></pre></div>\n<p>두 번째는 SQL 함수나 자연어 SDK를 추가하는 방식입니다.\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 할애합니다.\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p>데이터 디스커버리 영역의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 메타데이터 관리 영역입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. 메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다. AI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다. 플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":0,"humanPageNumber":1,"skip":0,"limit":6,"numberOfPages":7,"previousPagePath":"","nextPagePath":"/tag/dataengineering/2"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
+{"componentChunkName":"component---src-templates-tag-js","path":"/tag/dataengineering","result":{"data":{"contentfulTag":{"title":"DataEngineering","id":"25d7d0d6-3cf7-5e19-a5cb-9c3fa926046f","slug":"dataengineering","post":[{"id":"3bc2c838-2281-5852-899f-ba16e366f41b","title":"AI를 통해 변화하는 데이터플랫폼 근황","slug":"llm-dataplatform","publishDate":"January 21, 2024","publishDateISO":"2024-01-21","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.<br>\n오늘은 데이터플랫폼 영역에서 AI를 통해 어떤 변화가 나타나고 있는지 정리해보려 합니다.</p>\n<br>\n<h2 id=\"자연어를-sql로-변환-text2sql-sql2text\" style=\"position:relative;\"><a href=\"#%EC%9E%90%EC%97%B0%EC%96%B4%EB%A5%BC-sql%EB%A1%9C-%EB%B3%80%ED%99%98-text2sql-sql2text\" aria-label=\"자연어를 sql로 변환 text2sql sql2text permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>자연어를 SQL로 변환 (Text2SQL, SQL2Text)</h2>\n<p>지난 수 년간 클라우드 마이그레이션이 늘어남에 따라 <code class=\"language-text\">Databrics</code>, <code class=\"language-text\">Snowflake</code>와 같은 Managed DW 서비스도 함께 성장해왔습니다. Managed DW 서비스가 23년 Summit에 내세운 키워드는 생성형 AI 였습니다. 다양한 기능을 공개했지만 핵심은 <strong>Text2SQL, SQL2Text</strong> 기술이라고 볼 수 있습니다.</p>\n<p>Text2SQL이란 <strong>주어진 자연어로부터 쿼리문을 생성</strong>하는 것을 말합니다.<br>\n쉽게 말해 사용자가 AI에게 한글로 질문하면 필요한 쿼리를 만들어주는 기능입니다.\n데이터플랫폼에서는 그 동안 쿼리 사용에 어려움을 겪는 비개발자도 쉽게 사용할 수 있도록 다양한 데이터 분석 도구들을 만들어왔습니다. 하지만 이제 UI가 아닌 \"자연어\" 라는 인터페이스를 통해 쉽게 탐색할 수 있게 되었습니다. Text2SQL 기술을 플랫폼에 적용하는 방식은 크게 두 가지로 볼 수 있습니다.</p>\n<br>\n<p><strong>검색 UI 연동</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.21052631578948%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAACfFBMVEUfMzkuP0U0RUspO0FQXGFUX2RTXmNSXmJSXmNRXWJSXWJJVltGU1hMWF1BTlQSJy0VKC4fLTIdMTccMDchNTsfMzocMDYUKC4lTmdXcoK7wsWvvMGxvsS1wMbAyMvFysvHzM7GzM3Gy83ExcjEx8nEyMnFyMnFyckdOkloeoP09fbD2Om/1ujB2OnK3ez7/Pz+/v78/f37+/v8/P36+/z3+fr6+vvn5ebb3Nzr6+v27e/16ez37vD05un17/D3+Pj6+PcZLjRndXmFsdODsNOFstSNttfy8vPx8fHv8PDy8/Tu7u75+fnx9fTt7u/u7u/09fXp6uvu7/D4+fn4+Pn19vft7e709vfs8PP3+Pn7+Pn9/f37+fgZLTP9/f7b5u/l7fTp7PHv7+/u7/H8/Pz8+frw8fLo6uzo6+zn6uvl6Orn6evk5+jm6evi5ej6+/v7+vkXLDLe5+3s7Ozw8fHw8PD09PQWKzHf6fHc5e7n6ezt7fDy8vb37vH48vX5+P34+Prr5Ovn6Ojl5ubq6usdLjRodnry8vLu7+8vPEJqeH335+bl5ebr7Ozv8fL6+fgcMTf69/jv7/Do6Ojs7e3n5+f6+voYLDNndHn7+fnh5ury8/Xo6+3r7fDo6u35+PcZLTT09/r3+fv9/v7q6vLi4Obr6uvo5+j39/f6+fkTKC7k7PHk6/Ds8PHy9PXz9fX2+fn3+fn4+frZ2e3X1+Lq6env8vPw8vPu8PHr7e72+Pn4+vr09PXo6Onr6+zt7e/17+/07u36+PgaLjUYLTNodXnw9fjz9vnz9/nx9fj1+Prw8PH18fL08vLz8fL39fb49vf49/f19PT59/bdBKwSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEVCBYZGoTx/QAAAVRJREFUGBmNwb1LlHEAwPHv93c/rEPQsAIto8HRGsSnKQeHjECira3VoSGIhoYagiDoLxCqre3GaBAhQsQbOgrqElwbrpeliOQi4u7pnsd7wO7F+nzEAiqo7KPfJsxN2kVBulQyCsYjdmEKIYU2IbRDu2TmZzpqLk75edLCx5Pu+TFmjoJea0ybeU2fxH3isQZM6Psl1+nzisJiHIEpNdEr9NBTWvtALo5d2FljsKT5fcGjv0oNOmKUoeb0KZnZeeOhZ9MMM+KLpfqy+ojjrlp9x2DJOSVjRyhXGE5yabtFfHu1etPdrUv026Bsho6mla9Pbpujl59O+JLq3V2gGeH3qI9X9A69HlB22cuuwuEbjj/c3GnB7DZ9EmsUFgOUWsA2/xCeV8hd5GBB9qxzsFC/z3+JZ+vcYrCNM2ktkps7HVOYsWOFv4zPfLm3dn7hugq8mfcPG7FNxSnPL9QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"databricks1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/6vDGb4gWjJhAPwajyLYBYL/2cdde75af50010bbcb0d92f7a425ea80/databricks1.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>그 중 첫 번째는 <strong>검색 UI를 연동</strong>하는 방식입니다.<br>\n사이드에 어시스턴트를 추가함으로써 ChatGPT 서비스와 유사한 환경을 제공합니다.\n검색 UI는 쿼리문을 입력하는 쿼리 에디터 뿐만 아니라 노트북, 카탈로그 등 다양한 기능에 연결되어 있습니다.</p>\n<br>\n<p><strong>SQL 함수, 자연어 SDK 추가</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ai_query<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">'my-external-model-openai-chat'</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">'Describe Databricks SQL in 30 words.'</span>\n  <span class=\"token punctuation\">)</span> <span class=\"token keyword\">AS</span> summary\n\n<span class=\"token comment\"># english sdk</span>\nnew_df <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>ai<span class=\"token punctuation\">.</span>transform<span class=\"token punctuation\">(</span><span class=\"token string\">'get 4 week moving average sales by dept'</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>두 번째는 <strong>SQL 함수나 자연어 SDK를 추가</strong>하는 방식입니다.<br>\n이를 통해 사용자는 개발 과정에도 자연어를 활용할 수 있습니다.\n검색 UI와 달리 사용자의 검증을 거치지 않고 사용할 수 있지만, 일관된 답변을 보장 할 수 없는 관계로 운영 시스템에 직접 연동은 아직 어려울 것 같습니다.</p>\n<p>이처럼 다양한 방식을 지원함으로써 사용자는 AI에 쉽게 접근하고 일관된 개발 경험을 가질 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"기술-문서-검색\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%88%A0-%EB%AC%B8%EC%84%9C-%EA%B2%80%EC%83%89\" aria-label=\"기술 문서 검색 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기술 문서 검색</h2>\n<p>개발자는 개발 과정에서 문서 검색에 많은 시간을 사용합니다.<br>\nstackoverflow를 통해 검색하는 경우, 내가 사용하고 있는 프레임워크와 버전에 정확히 일치하는 문서를 찾지 못하는 경우도 많았습니다. 이제 데이터플랫폼 내에서 기술 문서와 코드를 기반으로 AI에게 질의할 수 있게 되었습니다.</p>\n<br>\n<p><strong>AWS Amazon Q Assistant</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAABP2lDQ1BpY2MAACiRY2BgEkksKMhhYWBgyM0rKQpyd1KIiIxSYH/GwM4gzcDDoM0glZhcXOAYEOADVMIAo1HBt2sMjCD6si7YrC87A26uXi0amitoOOv1i1mY6lEAV0pqcTKQ/gPEackFRSUMDIwpQLZyeUkBiN0BZIsUAR0FZM8BsdMh7A0gdhKEfQSsJiTIGci+AWQLJGckAs1gfAFk6yQhiacjsaH2ggCPU2peoIJ7uJG5hQEB55IOSlIrSkC0c35BZVFmekaJgiMwlFIVPPOS9XQUjAyMjBgYQGEOUf05EByWjGJnEGL5ixgYLL4yMDBPQIglzWRg2N7KwCBxCyGmsoCBgb+FgWHb+YLEokS4Axi/sRSnGRtB2DxODAys9/7//6zGwMA+mYHh74T//38v+v//72Kg+XcYGA7kAQDvjGF6f98jcAAAAAlwSFlzAAAXEQAAFxEByibzPwAAAAd0SU1FB+gBFQgWGRqE8f0AAAQ7SURBVEjHpVVbb9xEFM4P4YGKhqiQtKVAgOQtQu1L1QrRlEtDmkQqaQGhlsfCE78CUH8ECAn6gAQvqEnVJVDIbTcb7/qyvs2MPR57PL6szfG6yW6ylxYx+jQ7nj0+35yLvxmbnpmbOD0zM3fp7JtvT0xNj7909sT45HMnJobh5KkzL06eO/nya8+fmh4I8DN+enbq9blXZs6/Onvhhcm3zs1eGJ+aOX9x/p2ri4DLVxbOvDE31tKN6l69Lkm1+n59X5IaTdjph9bSi4VhaLqu6YZumPrG9+aDewBr7V5LlVzq/bO5Vdurr281vvu1qiHq+8ExMMdiVtO2Ebw+5lK6ubUF2N7Z3dqGqdo0MWweg+O6YK1qLThZU1Ys2ybr36o/fbn/41fm/bvUVizDNVRqar7c9B9tetjMCMoxyZGT2zS3WU54TkXOAt+QNia//m0MPMJZGo2mqmqKouimxQIeCvHs4JzDyZI0vb+WV1q5rhsYEwgLIUwpxRhrWgthbNu2aVlJkqTtds3yC2IhBCYErInjONTjIor/y4iiqCT+5i764ecMsvbX478dB/Yo83348X0f1h6DJz9N0yzL8jwvUs03f6GOjfwoHzLYwx23aRtU2CwyPZG2s2MGUGAgNs0izE6syDQtmAkhlmVBQBA97MM/UKMu8VqFaiiyPAGuNTdsZ8f9/ik9bCItHz4OiM1O0pyCGeNhxl3i9QpVbKHTELFIpwMCCip/OHIrTtujiesk2ifRHhYAWFeRsIJ0FPHv9W3NZZBD3Q2jZIB39mjXadhWJ88jiBUayzRWvUTuLJQODJaUMP0CmPfUuLrhGXaRZ8i2L5J+v0KqOJZidmoBM+7rhoI4SQw/LaGzpMUS3S92dD+1gxT4SJginrKo3SVmOw+gqftL203145qrImAFDEw4EHMeSk6R6ioKa0hsW7xOihkeg/hI8brEO5uWQUKoLo/SgcSpH2ZJ+tTmqhcFjsoZsItEtYNdWwRxNoDYceMkzfL/MUpiC2EDPhdQD/h4MIE17MAn1nKCBuYy4ZYXdYkdSkd4BJkJ4xTy29/qvRGUAhIEHHTD89ihShwa9L7dIyA8HAbPDwzimQ5zQUiH2FDPK4njOOEhaKhot9sjgjmIGLQ6KLQatN9hgegbIHTgWlFVWVFUTYObDOx7DUqtjpMke7ZRHuuJVrudwbjol2KIFJgYY5BGtxBgKo6KeanV1Od1xajJegu5iAbDoJjYYfxJqkc3DoQiooi4rscjxSmaH2QVIKHg8AuE5oLTuJ2rAI4y2mG3xk8lDrgwbAxxS025ISswSw250VQACK7cg64u7aHqnXsoKGe4e+BqgZkE8RHilZt3Vm598f7iTVi8t7h6+erSMVyavw7o3+/FxXc/Apsr124sr94psbR6e2Hls+XV29dvfD6/8PG1lU8/XP4EFrADRB8s3foXAmxOCLmBIAYAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAG3RFWHRpY2M6ZGVzY3JpcHRpb24AQmVuUSBHVzI3ODDUikcnAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"amazon-q\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=950 950w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=1900 1900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5xnJyR1xUOFjYnT3YBz8hU/6225678990955a0eb7a26796eb614f39/amazon-q.png?w=3800 3800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Amazon Q는 AWS에서 출시한 생성형 AI 어시스턴트입니다.<br>\nAWS 콘솔 우측에 추가되어 AWS 클라우드와 관련된 다양한 질의를 수행할 수 있습니다.</p>\n<br>\n<p><strong>GitHub Dosu</strong></p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.21052631578947%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQECCAgJTQmyAiJYCUEFoA6UWwEZIAocQYCCp2dFHBtYsI2NBVEcUOiB2xsyj2vlhQUNbFgl15kwK67ivfO9839/73nzP/OXPu3DIA0E/wJJIcVBOAXHG+NDYkgDkmOYVJ6gIIQAEdUIETj58nYUdHRwBoA+e/27sb0BvaVUe51j/7/6tpCYR5fACQaIjTBHn8XIgPAIBX8SXSfACIct5iSr5EjmEDOlKYIMQL5ThDiavkOE2J9yh84mM5ELcAoEbl8aQZAGhchjyzgJ8BNTR6IXYWC0RiAOhMiH1zcycJIE6F2Bb6SCCW67PSftDJ+Jtm2qAmj5cxiJVzUZhaoChPksOb9n+W439bbo5sIIY1bNRMaWisfM6wbreyJ4XLMRXiHnFaZBTE2hB/EAkU/hCjlExZaILSHzXi53FgzYAexM4CXmA4xEYQB4tzIiNUfFq6KJgLMVwh6FRRPjceYn2IFwrzguJUPhulk2JVsdD6dCmHreLP8aSKuPJYD2TZCWyV/utMIVelj2kUZsYnQUyB2LJAlBgJsQbETnnZceEqn1GFmZzIAR+pLFaevyXEsUJxSIBSHytIlwbHqvxLcvMG5ottzBRxI1V4X35mfKiyPlgLn6fIH84FuywUsxMGdIR5YyIG5iIQBgYp5451CcUJcSqdD5L8gFjlWJwiyYlW+ePmwpwQOW8OsWteQZxqLJ6YDxekUh9Pl+RHxyvzxAuzeGHRynzwZSACcEAgYAIZbGlgEsgCoraehh54pewJBjwgBRlACBxVzMCIJEWPGB7jQCH4EyIhyBscF6DoFYICyH8dZJVHR5Cu6C1QjMgGTyHOBeEgB17LFKPEg9ESwRPIiP4RnQcbH+abA5u8/9/zA+x3hg2ZCBUjG4jIpA94EoOIgcRQYjDRDjfEfXFvPAIe/WFzwVm458A8vvsTnhLaCY8I1wkdhNsTRUXSn7IcDTqgfrCqFmk/1gK3hppueADuA9WhMq6HGwJH3BXGYeN+MLIbZDmqvOVVYf6k/bcZ/HA3VH5kZzJKHkL2J9v+PFLDXsNtUEVe6x/ro8w1bbDenMGen+Nzfqi+AJ7Df/bEFmL7sbPYSew8dgRrAEzsONaItWJH5XhwdT1RrK6BaLGKfLKhjugf8QburLySec61zt3OX5R9+cKp8nc04EySTJOKMjLzmWz4RRAyuWK+0zCmi7OLKwDy74vy9fUmRvHdQPRav3Pz/gDA53h/f//h71zYcQD2esDH/9B3zpYFPx3qAJw7xJdJC5QcLj8Q4FuCDp80A2ACLIAtnI8LcAfewB8EgTAQBeJBMpgAs8+E61wKpoAZYC4oBqVgGVgNKsAGsBlsB7vAPtAAjoCT4Ay4CC6D6+AuXD2d4AXoBe/AZwRBSAgNYSAGiClihTggLggL8UWCkAgkFklGUpEMRIzIkBnIPKQUWYFUIJuQGmQvcgg5iZxH2pHbyEOkG3mNfEIxlIrqoMaoNTocZaFsNByNR8ejGehktBCdjy5By9FqdCdaj55EL6LX0Q70BdqHAUwd08PMMEeMhXGwKCwFS8ek2CysBCvDqrE6rAne56tYB9aDfcSJOANn4o5wBYfiCTgfn4zPwhfjFfh2vB5vwa/iD/Fe/BuBRjAiOBC8CFzCGEIGYQqhmFBG2Eo4SDgNn6VOwjsikahHtCF6wGcxmZhFnE5cTFxH3E08QWwnPib2kUgkA5IDyYcUReKR8knFpLWknaTjpCukTtIHNXU1UzUXtWC1FDWxWpFamdoOtWNqV9SeqX0ma5KtyF7kKLKAPI28lLyF3ES+RO4kf6ZoUWwoPpR4ShZlLqWcUkc5TblHeaOurm6u7qkeoy5Sn6Nerr5H/Zz6Q/WPVG2qPZVDHUeVUZdQt1FPUG9T39BoNGuaPy2Flk9bQquhnaI9oH3QYGg4aXA1BBqzNSo16jWuaLykk+lWdDZ9Ar2QXkbfT79E79Eka1prcjR5mrM0KzUPad7U7NNiaI3QitLK1VqstUPrvFaXNknbWjtIW6A9X3uz9intxwyMYcHgMPiMeYwtjNOMTh2ijo0OVydLp1Rnl06bTq+utq6rbqLuVN1K3aO6HXqYnrUeVy9Hb6nePr0bep+GGA9hDxEOWTSkbsiVIe/1h+r76wv1S/R361/X/2TANAgyyDZYbtBgcN8QN7Q3jDGcYrje8LRhz1Cdod5D+UNLhu4bescINbI3ijWabrTZqNWoz9jEOMRYYrzW+JRxj4meib9Jlskqk2Mm3aYMU19Tkekq0+Omz5m6TDYzh1nObGH2mhmZhZrJzDaZtZl9NrcxTzAvMt9tft+CYsGySLdYZdFs0WtpajnacoZlreUdK7IVyyrTao3VWav31jbWSdYLrBusu2z0bbg2hTa1NvdsabZ+tpNtq22v2RHtWHbZduvsLtuj9m72mfaV9pccUAd3B5HDOof2YYRhnsPEw6qH3XSkOrIdCxxrHR866TlFOBU5NTi9HG45PGX48uFnh39zdnPOcd7ifHeE9oiwEUUjmka8drF34btUulwbSRsZPHL2yMaRr1wdXIWu611vuTHcRrstcGt2++ru4S51r3Pv9rD0SPWo8rjJ0mFFsxazznkSPAM8Z3se8fzo5e6V77XP6y9vR+9s7x3eXaNsRglHbRn12Mfch+ezyafDl+mb6rvRt8PPzI/nV+33yN/CX+C/1f8Z246dxd7JfhngHCANOBjwnuPFmck5EYgFhgSWBLYFaQclBFUEPQg2D84Irg3uDXELmR5yIpQQGh66PPQm15jL59Zwe8M8wmaGtYRTw+PCK8IfRdhHSCOaRqOjw0avHH0v0ipSHNkQBaK4USuj7kfbRE+OPhxDjImOqYx5Gjsidkbs2ThG3MS4HXHv4gPil8bfTbBNkCU0J9ITxyXWJL5PCkxakdQxZviYmWMuJhsmi5IbU0gpiSlbU/rGBo1dPbZznNu44nE3xtuMnzr+/ATDCTkTjk6kT+RN3J9KSE1K3ZH6hRfFq+b1pXHTqtJ6+Rz+Gv4Lgb9glaBb6CNcIXyW7pO+Ir0rwydjZUZ3pl9mWWaPiCOqEL3KCs3akPU+Oyp7W3Z/TlLO7ly13NTcQ2Jtcba4ZZLJpKmT2iUOkmJJx2Svyasn90rDpVvzkLzxeY35OvBHvlVmK/tF9rDAt6Cy4MOUxCn7p2pNFU9tnWY/bdG0Z4XBhb9Nx6fzpzfPMJsxd8bDmeyZm2Yhs9JmNc+2mD1/dueckDnb51LmZs/9vci5aEXR23lJ85rmG8+fM//xLyG/1BZrFEuLby7wXrBhIb5QtLBt0chFaxd9KxGUXCh1Li0r/bKYv/jCryN+Lf+1f0n6kral7kvXLyMuEy+7sdxv+fYVWisKVzxeOXpl/SrmqpJVb1dPXH2+zLVswxrKGtmajvKI8sa1lmuXrf1SkVlxvTKgcneVUdWiqvfrBOuurPdfX7fBeEPphk8bRRtvbQrZVF9tXV22mbi5YPPTLYlbzv7G+q1mq+HW0q1ft4m3dWyP3d5S41FTs8Nox9JatFZW271z3M7LuwJ3NdY51m3arbe7dA/YI9vzfG/q3hv7wvc172ftrztgdaDqIONgST1SP62+tyGzoaMxubH9UNih5ibvpoOHnQ5vO2J2pPKo7tGlxyjH5h/rP154vO+E5ETPyYyTj5snNt89NebUtZaYlrbT4afPnQk+c+os++zxcz7njpz3On/oAutCw0X3i/Wtbq0Hf3f7/WCbe1v9JY9LjZc9Lze1j2o/dsXvysmrgVfPXONeu3g98nr7jYQbt26Ou9lxS3Cr63bO7Vd3Cu58vjvnHuFeyX3N+2UPjB5U/2H3x+4O946jDwMftj6Ke3T3Mf/xiyd5T750zn9Ke1r2zPRZTZdL15Hu4O7Lz8c+73whefG5p/hPrT+rXtq+PPCX/1+tvWN6O19JX/W/XvzG4M22t65vm/ui+x68y333+X3JB4MP2z+yPp79lPTp2ecpX0hfyr/afW36Fv7tXn9uf7+EJ+UpfgUw2ND0dABebwOAlgwAA+7PKGOV+z+FIco9qwKB/4SVe0SFuQNQB//fY3rg381NAPZsgdsvqE8fB0A0DYB4T4COHDnYBvZqin2l3IhwH7Ax6mtabhr4N6bcc/6Q989nIFd1BT+f/wUvonxXpSgKGwAAAcJQTFRF////4ODh4OHh4eHi5OTl5ubn3+Dg4+Tk39/g3d3e5eXm7u/w9fX28O3r9fb28PHy8vP09/f48PHx+Pj4/f3+/f39+vv7+fn6+Pj59ff59vf59ff4+/v84uLj3Nzd3t/f+fn519jZ6err4OLl2dzf7vDz3eDj+vv8/f7+/v7+09TRyMnH3t7f3d7e2tvb7/Dx9PX27O3u/Pz96uvr7+/w8/P08vPz9vb38fX87/P89fj9+/v7+vr6+vv++fr+/P3+8PP08/T009PU29vc2Nna6Ojo6erq6enq6+vs6Ojp6Onp5+fo6urr6+vr5ufn9PT17Ozs6urq5ebm7e3t7u7u6enp5eXl5+jo5OXl7u/v7O3t4uTl5+fn5ebn4+Pk8vLy4ePk9PX16Onq6+zt+/z98urs6urs6evt8OPl7+rq7eno9vj66evu8/X2/P392trb3t/g2drb2tvc4eLj2tzd1dfY4OHi3N3d29zd3+Dh3d7f6+zs7u7v1NXW1tbX2NnZ9PT08/Pz9fX18fHy8fHx8PDw8PDx8fLy7+/v6enr4ePl5+nr5Obo5efp5efq5Obp7uvt8eXn7uno8O7u6ezu+fr7GtnbHAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFQgWGRqE8f0AAAGESURBVCjPY2AAAkYmZhZWNnYOThYubh4GPICXhYWdj19AUEgYjyIRIBAVwQ7ExCUkpaSkZUBssGJZOXmshigoKimrqKqpwwVERTXwAU24Qi1tHV09fQNuQyMMQ41NNI004DwJUzNzC0srXN5AKLQWsxG1tbMnrNBBFF/gISl0ZFR0cnZxdXNzl/Xw9PL29PH1c/PicvPlUkBT6O8eEOjlGRTMwhoQwBzizu7h5x3qGeblFe4ZYRzGwoNkojFLpEdEVGgQq3F0VISPp0eMl3usUoSnMUuch2tcPEKhYEJUhCYxbkx0cwPa5c3F5crq5ZWUzOoWyurnzuWpgaHQSB0fSEEoVE9NS8/IzMrGCnJyEQrzYCAlJcUoDwGMUkBieQiFQvkFhbI6ckVxxSWlZc4F5cyFbBxyHMwVlRVV8ozVwgiFNbV1nPUNjU3NLfGt8ab+DS1t7c1C8TXm8Y0d8c3xTchWI1uIBpCtVk/t7Oru6e3rnzBx0mR0z0xB8oxRCh4wFRI8AKHqi34WwB4jAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyMzEwznbQcgAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTI1Mu6YamsAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyNA3XGqkAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ai-dosu\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/kkCNngKHkwAywSxlLxQ7P/1b7787dbcaf4c5b1f08dbacb62b9b3c4/dosu.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>오픈소스 영역에서도 생성형 AI를 통해 Issue, Discussion 문의 대응하는 사례가 생기고 있습니다. 위 그림은 LLM 프레임워크인 LangChain에서 사용하는 <a href=\"https://github.com/apps/dosubot\">Dosu</a> 봇 입니다.\n출시 예정인 GitHub Copilot도 이와 유사한 기능을 지원합니다.\n이러한 기능을 통해 사용자는 빠르게 문제를 해결하고 메인테이너는 중요한 의사결정에 집중할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"데이터-거버넌스-도구\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0-%EA%B1%B0%EB%B2%84%EB%84%8C%EC%8A%A4-%EB%8F%84%EA%B5%AC\" aria-label=\"데이터 거버넌스 도구 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터 거버넌스 도구</h2>\n<p>데이터 거버넌스는 정책을 만드는 일보다 운영하는데 더 많은 노력이 들어갑니다.<br>\n거버넌스 내에는 다양한 영역이 있지만 그 중 데이터 디스커버리와 메타데이터 관리에 AI가 활용되고 있습니다.</p>\n<p><strong>데이터 디스커버리 영역</strong>의 경우, 기존 UI 기반 검색 엔진에 자연어 질의가 추가됩니다.<br>\n이를 통해 앞서 언급한 Text2SQL과 유사한 경험을 제공할 수 있습니다.</p>\n<p>다음은 <strong>메타데이터 관리 영역</strong>입니다. 메타데이터 관리는 데이터 신뢰도를 위해 데이터 생산자와 소비자 모두에게 중요합니다. 하지만 거버넌스 정책이 새로 추가되거나 변경되면 데이터에 대한 오너십을 가지는 도메인 전문가는 이를 항상 인지하기 어렵습니다. 만약 불일치가 발생하면 거버넌스 담당자가 보정하는 작업을 수행하는 경우도 있습니다. <strong>메타데이터 영역의 AI는 거버넌스 정책을 유지하고 메타데이터 입력을 도와주는 역할</strong>을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.36842105263158%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAABiVBMVEX+/v729vb6+vr////m5ubj4+Pn5+fr6+vs7Ozt7e3u7u7v7+/p6enq6uro6Oj2+/bq8vbj7vPt9Pfr8vZ3rMOBssd5rcSAsceYwNHy8vLk5OTi4uLh4eHl5eX4+vj1+fv2+vv3+vvz9/moyNapydeqydfA1+L09PT29vfz8/P5+vrx8fLw8PDw8PH8/Pz4/P/4/P75/P/x8fH5+fnv9/7k5OXw8fL8/f33+/77/f/6/f/39/fY5OnZ5erW4+nb5uvu8e7w8/D19fX3+Pv29/v19fr9/f37/fvx+fL1+vX0+vTx9vHu8+75/Pnk8+TV3dXR2tHO1s7P2M/P18/V3tXQ2NDU3dTf6N/g6eDk7eTt9+3Y5dje6t7m8ObZ4tnn8ef8/fzv9u/k6+Ti6eLh6OHj6uPh5+Hi6OLe5N7i6ePg5+jh6On4+Pj7+/vu9e7n9Ofs8PDv8/Pl6ery9vb6+/vu9u/6/fr9/v7k7vNNkrBFja2Htcru8u7q7ery8/Ly8/PX4eXV3+Ti6OpL3/WcAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEVCBYZGoTx/QAAAcBJREFUKM+Nkudz0zAYhzUay5Zis4ccAhQKQtSoJaFAY6AgQBA30DIKZVMI2wHK3qX85UjOHXccLs2jL3pPj34a9wIAERgIPFTxiE8C6gUBq9KqT0MW0shfgx1r163fsHHT5i1bMcBRNeIk9rzakB9V4m0xrcb1KK5vL8QdO4d37R4Z2bPXikLsk3w/hHKUjyYHFP6HsfHxg2NWbCRN/F8OTRw+ctSKqzLZarUmMUiPHT8xdZKcCkmgiUxXBKABASgVHErBpZDy9JmzKxxvrHjufDvLsrYdWbuELJvudKadeOHizOyly1euzs3OXbs+P3/j5t/cun1n5u69+05cePCw+6j7uPuk+/TZ8xcLpTgxlw3ZWw33GKWL60JttDR20sxdCbh2X5wL+OcxRhTNAaXSUtkJyotaC1fksr/qxJyw8CXGFOOABgF89XrxzdtFrALK7FHcpyzFWDhRQZ3241MIhdAu4B0o+cc0ish7jJNcaZY0kuJOPVOSaJoIFbsUC6WyINRDpiQRxhWv8wGzpkqJH/o+IUyWJgID+vv7Pfvx0/DnL19LE2u1esX79j03UkrOfywt/Vz+VZJoBmqynvkNebp0G8uqdKYAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTA3MIjfZkMAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADYxNMAEQsYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-datazone\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/10e8Ag42pCYDQDLMb20F2G/1e9f969455d2ad4174f899824f45eca9/aws-datazone.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 AWS DataZone 입니다.<br>\nAI를 통해 입력된 메타데이터를 리뷰하여 올바른 내용으로 교정할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 600px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 72.66666666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAByFBMVEUAAABoEhTc3Nzc3Ny0TUnosK7m5ubm5uYAAAAAAAAAAAAAAAAAAAAAAAAAAAC0TEjsuLXY2NgAAAAAAAAAAAA6GBfMUUObKRybm5ujLiDZ2dnm5ubc3Nzg4OCdnZ2NjY20TUnvvbvywr/HdW0AAAAAAAAAAAAAAAAAAAClNCeVJhjEQTKfKx4AAAAAAAAAAAClLiIAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADE3b3M4sjF2sG+0rrE3b3Q0NCZmZnM4sjM4sgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACdnZ1KSkrA1LwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADK4cbK4cYAAACJt3CKuHFPakFSbkMAAAAAAAAAAAAAAAAAAAAAAAAAAADq6urj4+Po6OjxwL7zxML19fXd3d3ExMTIyMjh4eH1ycf3zcv1y8n4zsz0y8nt7e2/v7/AwMC9vb309PT2ycfowb+8nJvDoqC9nZzAoJ67m5rUqabQkIvZ2dnCwsLMzMyzs7PQhX7AQDGeLB/BQDCfLB/V6NTK3Mmdq5yntaamtKWXpZajsqKisaHT5tLT5tHDFPxUAAAAaHRSTlMAALy7CW+8uwVLQUA1SgEJb8cVFhkdpx/PvpDEzcjTrwfExN83GmxuByZ9szskCRIBAgNHODM7CCo+SEI6NIa2vMOFmCG8uy4jFygsLSkLiibHFB4mKyIwHyG8uxELDhkYGBMKGw0xBnNoKMoAAAAJcEhZcwAAFxEAABcRAcom8z8AAAAHdElNRQfoARUIFhkahPH9AAABc0lEQVQ4y2NgAAOmjIzMrKysjAxmBiTAkp0DBawwIbbc3Lz8gsLcXHYGBg5OLm4ebl4+Bgb+ouKS0rJSIBBAKCyvqKysqs4V5BESEhIWEhECAdGa2rr6hsam5hYxcbjC1rb8/IL2DgkRJKv5i0rBoLOrWxIqJCUtIw0EsnLyyG5UUFQCA+WeXkm4oAqIUFVT12DABJpa2jpwjhCI0NXT0MeikIHRgAFVoRADbsBnyIek0AgowIddoZCKsYkpj5k5RKGFJbeVtY0uHoMJW02eQluCyuzsHeyBwNHeCYukswuC7doHBW4MDMLuHqaeXt6mFj4ivqbAGPXzD0BS2D9h4qTJU6ZOC+QJElHRtQj28g4J9Q0L944ICgqKZMBmIpZQjDREsKOmQ0E0proYc6QUFRsXFxefACRiMRUmJgWhWuOXjD1EUrx8GIhSyKAfQaRCIyEiFfIFDRqFGqpCOEAqA26ga2PhnWbCQBik62lopOshCQAAFSVgPM62YSQAAChtdEVYdG14ZmlsZQAlM0NteGZpbGUlMjBob3N0JTNEJTIyd2lraS5ncmFiLmNvbSUyMiUyMG1vZGlmaWVkJTNEJTIyMjAyMy0wOS0wNFQwOCUzQTA4JTNBNDAuNzg4WiUyMiUyMGFnZW50JTNEJTIyTW96aWxsYSUyRjUuMCUyMChNYWNpbnRvc2glM0IlMjBJbnRlbCUyME1hYyUyME9TJTIwWCUyMDEwXzE1XzcpJTIwQXBwbGVXZWJLaXQlMkY1MzcuMzYlMjAoS0hUTUwlMkMlMjBsaWtlJTIwR2Vja28pJTIwQ2hyb21lJTJGMTE2LjAuMC4wJTIwU2FmYXJpJTJGNTM3LjM2JTIyJTIwZXRhZyUzRCUyMktDR3lTRUl3c2tkanNhQlFDaDhOJTIyJTIwdmVyc2lvbiUzRCUyMjIxLjQuMCUyMiUyMHR5cGUlM0QlMjJhdGxhcyUyMiUzRSUwQSUyMCUyMCUzQ2RpYWdyYW0lMjBpZCUzRCUyMjNONUVTLU9MbW5lVzE4S09BRzRGJTIyJTIwbmFtZSUzRCUyMlBhZ2UtMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUzQ214R3JhcGhNb2RlbCUyMGR4JTNEJTIyMjQ3NCUyMiUyMGR5JTNEJTIyMTIwNSUyMiUyMGdyaWQlM0QlMjIxJTIyJTIwZ3JpZFNpemUlM0QlMjIxMCUyMiUyMGd1aWRlcyUzRCUyMjElMjIlMjB0b29sdGlwcyUzRCUyMjElMjIlMjBjb25uZWN0JTNEJTIyMSUyMiUyMGFycm93cyUzRCUyMjElMjIlMjBmb2xkJTNEJTIyMSUyMiUyMHBhZ2UlM0QlMjIwJTIyJTIwcGFnZVNjYWxlJTNEJTIyMSUyMiUyMHBhZ2VXaWR0aCUzRCUyMjgyNyUyMiUyMHBhZ2VIZWlnaHQlM0QlMjIxMTY5JTIyJTIwbWF0aCUzRCUyMjAlMjIlMjBzaGFkb3clM0QlMjIwJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTNDcm9vdCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyMSUyMiUyMHBhcmVudCUzRCUyMjAlMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTklMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMSUzQmV4aXRZJTNEMC41JTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0JlbnRyeVglM0QwJTNCZW50cnlZJTNEMC41JTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQnN0YXJ0QXJyb3clM0RjbGFzc2ljJTNCc3RhcnRGaWxsJTNEMSUzQmVuZEFycm93JTNEbm9uZSUzQmVuZEZpbGwlM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS00JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC43NSUzQmV4aXRZJTNEMSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZW50cnlYJTNEMC43NSUzQmVudHJ5WSUzRDAlM0JlbnRyeUR4JTNEMCUzQmVudHJ5RHklM0QwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHNvdXJjZSUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTMlMjIlMjB0YXJnZXQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwZWRnZSUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIwcmVsYXRpdmUlM0QlMjIxJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMHZhbHVlJTNEJTIyR2VtaW5pJTIwJTI2bHQlM0JiciUyNmd0JTNCKE1ldGFkYXRhJTIwR2VuZXJhdGlvbiklMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y1ZjVmNSUzQnN0cm9rZUNvbG9yJTNEJTIzNjY2NjY2JTNCZm9udENvbG9yJTNEJTIzMzMzMzMzJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMi02MCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNCUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFNvdXJjZXMlMjIlMjBzdHlsZSUzRCUyMnJvdW5kZWQlM0QwJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0JodG1sJTNEMSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRCUyM2Y4Y2VjYyUzQnN0cm9rZUNvbG9yJTNEJTIzYjg1NDUwJTNCJTIyJTIwcGFyZW50JTNEJTIyMSUyMiUyMHZlcnRleCUzRCUyMjElMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteEdlb21ldHJ5JTIweCUzRCUyMjIzMCUyMiUyMHklM0QlMjIxMDAlMjIlMjB3aWR0aCUzRCUyMjEyMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMHZhbHVlJTNEJTIyRGF0YSUyMFBsYXRmb3JtcyUyMiUyMHN0eWxlJTNEJTIycm91bmRlZCUzRDAlM0J3aGl0ZVNwYWNlJTNEd3JhcCUzQmh0bWwlM0QxJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEJTIzZDVlOGQ0JTNCc3Ryb2tlQ29sb3IlM0QlMjM4MmIzNjYlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyLTYwJTIyJTIweSUzRCUyMjI3MCUyMiUyMHdpZHRoJTNEJTIyMTIwJTIyJTIwaGVpZ2h0JTNEJTIyNjAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS03JTIyJTIwdmFsdWUlM0QlMjIlMjIlMjBzdHlsZSUzRCUyMmVuZEFycm93JTNEY2xhc3NpYyUzQmh0bWwlM0QxJTNCcm91bmRlZCUzRDAlM0JleGl0WCUzRDAuMjUlM0JleGl0WSUzRDAlM0JleGl0RHglM0QwJTNCZXhpdER5JTNEMCUzQmVudHJ5WCUzRDAuMjUlM0JlbnRyeVklM0QxJTNCZW50cnlEeCUzRDAlM0JlbnRyeUR5JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjBzb3VyY2UlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS01JTIyJTIwdGFyZ2V0JTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMyUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHdpZHRoJTNEJTIyNTAlMjIlMjBoZWlnaHQlM0QlMjI1MCUyMiUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjE4MCUyMiUyMHklM0QlMjIzMTAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIyMzAlMjIlMjB5JTNEJTIyMjYwJTIyJTIwYXMlM0QlMjJ0YXJnZXRQb2ludCUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14R2VvbWV0cnklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTglMjIlMjB2YWx1ZSUzRCUyMkVudGl0aWVzJTIwdG8lMjBzY2FuJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjItMTQwJTIyJTIweSUzRCUyMjIwNSUyMiUyMHdpZHRoJTNEJTIyMTAwJTIyJTIwaGVpZ2h0JTNEJTIyMzAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0xMCUyMiUyMHZhbHVlJTNEJTIyU2FtcGxpbmclMjBEYXRhJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjI5MCUyMiUyMHklM0QlMjIxMDUlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMTIlMjIlMjB2YWx1ZSUzRCUyMlRhZyUyMHByZWRpY3Rpb25zJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JhbGlnbiUzRGNlbnRlciUzQnZlcnRpY2FsQWxpZ24lM0RtaWRkbGUlM0JyZXNpemFibGUlM0QwJTNCcG9pbnRzJTNEJTVCJTVEJTNCYXV0b3NpemUlM0QxJTNCc3Ryb2tlQ29sb3IlM0Rub25lJTNCZmlsbENvbG9yJTNEbm9uZSUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIyMTAlMjIlMjB3aWR0aCUzRCUyMjEwMCUyMiUyMGhlaWdodCUzRCUyMjIwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktMjElMjIlMjB2YWx1ZSUzRCUyMiUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0RpbWFnZSUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQmxhYmVsQmFja2dyb3VuZENvbG9yJTNEZGVmYXVsdCUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0Jhc3BlY3QlM0RmaXhlZCUzQmltYWdlQXNwZWN0JTNEMCUzQmltYWdlJTNEaHR0cHMlM0ElMkYlMkZ1cGxvYWQud2lraW1lZGlhLm9yZyUyRndpa2lwZWRpYSUyRmNvbW1vbnMlMkZ0aHVtYiUyRjQlMkY0MyUyRkdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnJTJGMTIwMHB4LUdlbWluaV9zeW1ib2xfJTI1Mjhib2xkJTI1Mjkuc3ZnLnBuZyUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMiUyMiUyMHklM0QlMjIxNDIlMjIlMjB3aWR0aCUzRCUyMjQwJTIyJTIwaGVpZ2h0JTNEJTIyNDAlMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJhTm5sMVIwelNScUItaVR6MEFaOS0yNiUyMiUyMHZhbHVlJTNEJTIyJTIyJTIwc3R5bGUlM0QlMjJzaGFwZSUzRGltYWdlJTNCdmVydGljYWxMYWJlbFBvc2l0aW9uJTNEYm90dG9tJTNCbGFiZWxCYWNrZ3JvdW5kQ29sb3IlM0RkZWZhdWx0JTNCdmVydGljYWxBbGlnbiUzRHRvcCUzQmFzcGVjdCUzRGZpeGVkJTNCaW1hZ2VBc3BlY3QlM0QwJTNCaW1hZ2UlM0RodHRwcyUzQSUyRiUyRnVwbG9hZC53aWtpbWVkaWEub3JnJTJGd2lraXBlZGlhJTJGY29tbW9ucyUyRnRodW1iJTJGYiUyRmJjJTJGQW1hem9uLVMzLUxvZ28uc3ZnJTJGMTcxMnB4LUFtYXpvbi1TMy1Mb2dvLnN2Zy5wbmclM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyMzI1JTIyJTIweSUzRCUyMjEyNS41JTIyJTIwd2lkdGglM0QlMjI0NC4zNCUyMiUyMGhlaWdodCUzRCUyMjUzJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMiUyMiUyMHN0eWxlJTNEJTIyZWRnZVN0eWxlJTNEb3J0aG9nb25hbEVkZ2VTdHlsZSUzQnJvdW5kZWQlM0QwJTNCb3J0aG9nb25hbExvb3AlM0QxJTNCamV0dHlTaXplJTNEYXV0byUzQmh0bWwlM0QxJTNCZXhpdFglM0QwLjUlM0JleGl0WSUzRDAuNSUzQmV4aXREeCUzRDAlM0JleGl0RHklM0QwJTNCZXhpdFBlcmltZXRlciUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMSUyMiUyMHRhcmdldCUzRCUyMmFObmwxUjB6U1JxQi1pVHowQVo5LTUlMjIlMjBlZGdlJTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjByZWxhdGl2ZSUzRCUyMjElMjIlMjBhcyUzRCUyMmdlb21ldHJ5JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJtczNQRE1WOTdmdG8yY1pEMDJkaC0xJTIyJTIwdmFsdWUlM0QlMjJPd25lciUyMiUyMHN0eWxlJTNEJTIyc2hhcGUlM0R1bWxBY3RvciUzQnZlcnRpY2FsTGFiZWxQb3NpdGlvbiUzRGJvdHRvbSUzQnZlcnRpY2FsQWxpZ24lM0R0b3AlM0JodG1sJTNEMSUzQm91dGxpbmVDb25uZWN0JTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIzMDAlMjIlMjB5JTNEJTIyMjcwJTIyJTIwd2lkdGglM0QlMjIzMCUyMiUyMGhlaWdodCUzRCUyMjYwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214Q2VsbCUyMGlkJTNEJTIybXMzUERNVjk3ZnRvMmNaRDAyZGgtMyUyMiUyMHZhbHVlJTNEJTIyVGFnJTIwZWRpdHMlMjAlMkYlMjBjbGFzc2lmaWNhdGlvbiUyMHVwZGF0ZSUyMiUyMHN0eWxlJTNEJTIydGV4dCUzQmh0bWwlM0QxJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCcmVzaXphYmxlJTNEMCUzQnBvaW50cyUzRCU1QiU1RCUzQmF1dG9zaXplJTNEMSUzQnN0cm9rZUNvbG9yJTNEbm9uZSUzQmZpbGxDb2xvciUzRG5vbmUlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwdmVydGV4JTNEJTIyMSUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214R2VvbWV0cnklMjB4JTNEJTIyODklMjIlMjB5JTNEJTIyMjgwJTIyJTIwd2lkdGglM0QlMjIxODAlMjIlMjBoZWlnaHQlM0QlMjIyMCUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlMjAlMkYlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteENlbGwlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteENlbGwlMjBpZCUzRCUyMlEtcUFPV3VYMDN4ZVM2QVo5dXpXLTElMjIlMjBzdHlsZSUzRCUyMmVkZ2VTdHlsZSUzRG9ydGhvZ29uYWxFZGdlU3R5bGUlM0Jyb3VuZGVkJTNEMCUzQm9ydGhvZ29uYWxMb29wJTNEMSUzQmpldHR5U2l6ZSUzRGF1dG8lM0JodG1sJTNEMSUzQmV4aXRYJTNEMC41JTNCZXhpdFklM0QxJTNCZXhpdER4JTNEMCUzQmV4aXREeSUzRDAlM0IlMjIlMjBwYXJlbnQlM0QlMjIxJTIyJTIwc291cmNlJTNEJTIyYU5ubDFSMHpTUnFCLWlUejBBWjktNSUyMiUyMGVkZ2UlM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHJlbGF0aXZlJTNEJTIyMSUyMiUyMGFzJTNEJTIyZ2VvbWV0cnklMjIlM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0NteFBvaW50JTIweCUzRCUyMjMyMCUyMiUyMHklM0QlMjIzNjAlMjIlMjBhcyUzRCUyMnRhcmdldFBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjI2MCUyMiUyMHklM0QlMjI0NDAlMjIlMjBhcyUzRCUyMnNvdXJjZVBvaW50JTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDQXJyYXklMjBhcyUzRCUyMnBvaW50cyUyMiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQ214UG9pbnQlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhQb2ludCUyMHglM0QlMjIzMjAlMjIlMjB5JTNEJTIyNDQwJTIyJTIwJTJGJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGQXJyYXklM0UlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlM0MlMkZteEdlb21ldHJ5JTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDJTJGbXhDZWxsJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhDZWxsJTIwaWQlM0QlMjJRLXFBT1d1WDAzeGVTNkFaOXV6Vy0yJTIyJTIwdmFsdWUlM0QlMjJTbGFjayUyMCUyRiUyMEVtYWlsJTIyJTIwc3R5bGUlM0QlMjJ0ZXh0JTNCaHRtbCUzRDElM0JzdHJva2VDb2xvciUzRG5vbmUlM0JmaWxsQ29sb3IlM0Rub25lJTNCYWxpZ24lM0RjZW50ZXIlM0J2ZXJ0aWNhbEFsaWduJTNEbWlkZGxlJTNCd2hpdGVTcGFjZSUzRHdyYXAlM0Jyb3VuZGVkJTNEMCUzQiUyMiUyMHBhcmVudCUzRCUyMjElMjIlMjB2ZXJ0ZXglM0QlMjIxJTIyJTNFJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTNDbXhHZW9tZXRyeSUyMHglM0QlMjIxNDklMjIlMjB5JTNEJTIyNDQwJTIyJTIwd2lkdGglM0QlMjI5MSUyMiUyMGhlaWdodCUzRCUyMjMwJTIyJTIwYXMlM0QlMjJnZW9tZXRyeSUyMiUyMCUyRiUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRm14Q2VsbCUzRSUwQSUyMCUyMCUyMCUyMCUyMCUyMCUzQyUyRnJvb3QlM0UlMEElMjAlMjAlMjAlMjAlM0MlMkZteEdyYXBoTW9kZWwlM0UlMEElMjAlMjAlM0MlMkZkaWFncmFtJTNFJTBBJTNDJTJGbXhmaWxlJTNFJTBBXDZ7fAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"grab-ai\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=150 150w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=300 300w,\nhttps://images.ctfassets.net/tushy4jlcik7/1ltwuHcmOkM0WJXbhnvkA8/b1d5ad10afd55a1a99729de0a017c437/grab-ai.png?w=600 600w\"\n        sizes=\"(max-width: 600px) 100vw, 600px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Grab의 경우, <strong>LLM이 데이터 분류를 위한 태그를 생성하고 거버넌스 담당자가 확인 후 승인하는 프로세스</strong>를 개발했습니다. 이를 통해 민감도 분류, 개인정보 컬럼에 PII 태그를 붙이는 등의 거버넌스 정책을 20,000개 이상 데이터에 일관되게 적용할 수 있었습니다.</p>\n<p><br><br></p>\n<h2 id=\"플랫폼에-ai를-사용하는-이유\" style=\"position:relative;\"><a href=\"#%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%97%90-ai%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0\" aria-label=\"플랫폼에 ai를 사용하는 이유 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>플랫폼에 AI를 사용하는 이유</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 84.94736842105263%; position: relative; bottom: 0; left: 0; background-image: url('data:image/webp;base64,UklGRiABAABXRUJQVlA4IBQBAABQBwCdASooACIAPo06mEelI6KhLjgMyKARiWcAy7X/5dvkhVWPjjEnZXnh/ULB2XcnSBpVluJWlqunN0by4vGhaKpqAP79y4fpyVrMiB1ke+bs6S8c4seFGE8CqN2CVyfq4SKUxf+kFFWZiRjnCPRxhExrM2DvfXV2O/Ia/twAd9S0WHaU5INIhIDMaUDMLh8jO0e9s6rMFLpezUkkrrwu6IS1rilwt/z22H8QpV+M489LQgxkHrOWb7vzcasHBHXZtjAbSyKBVy4OhXrkgHBxGgd6HvHM1as+KfBzb+CHVYUHjezyU6XomCodW17RdIfKO903FViyHatTXiCPwNIoENXYBQTAecasF9D0sJepx8RRsAA='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"github-copilot\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=238 238w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=475 475w,\nhttps://images.ctfassets.net/tushy4jlcik7/4W8POiyUyxzCi2diDKEEJv/307299e075f4b6ec47d23a8316dffeb4/copilot.png?w=950 950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GitHub Copilot Research에 따르면 Copilot 사용 시 55%의 생산성 증가 효과가 나타난다고 합니다.<br>\n플랫폼에 AI를 도입함으로써 사용자는 개발 생산성을 얻을 수 있고 기업은 운영 비용을 절감할 수 있습니다. 따라서 앞으로도 다양한 활용 사례가 추가될 것이라 예상합니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>실제 기능에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.</p>\n<ul>\n<li><a href=\"https://www.databricks.com/kr/blog/introducing-lakehouseiq-ai-powered-engine-uniquely-understands-your-business\">Databricks LakehouseIQ</a></li>\n<li><a href=\"https://www.snowflake.com/blog/use-ai-snowflake-cortex/\">Snowflake Copilot</a></li>\n<li><a href=\"https://docs.dremio.com/cloud/sonar/query-manage/querying-data/generative-ai/\">Dremio Text-to-SQL feature</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/korea/introducing-amazon-q-a-new-generative-ai-powered-assistant-preview/\">AWS Amazon Q Assistant</a></li>\n<li><a href=\"https://aws.amazon.com/ko/blogs/aws/amazon-redshift-adds-new-ai-capabilities-to-boost-efficiency-and-productivity/\">AWS Redshift Generative AI</a></li>\n<li><a href=\"https://engineering.grab.com/llm-powered-data-classification\">Grab LLM based data classification</a></li>\n<li><a href=\"https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/\">GitHub Copilot Research</a></li>\n</ul>","excerpt":"생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.\n오늘은 데이터플랫폼 영역에서 AI…"}}},{"id":"3d5aacf4-f336-5c17-a880-4efb995c9b99","title":"AWS에 Hadoop MR 어플리케이션 환경 구축하기","slug":"aws-hadoop","publishDate":"June 13, 2018","publishDateISO":"2018-06-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>이번 학기에 하둡 프로그래밍 강의를 들으면서 정말 실습 환경의 개선이 필요하다는 생각이 들었습니다...\n나약한 실습 환경속에서 과제와 기말 프로젝트를 제출해야하는 후배들을 위해 AWS를 추천합니다!</p>\n<br>\n<h2 id=\"ec2-amazon-linux2에-기본-환경-구축\" style=\"position:relative;\"><a href=\"#ec2-amazon-linux2%EC%97%90-%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"ec2 amazon linux2에 기본 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EC2 Amazon Linux2에 기본 환경 구축</h2>\n<p>AWS에는 EMR이라는 클러스터 서비스가 있지만, 스터디 목적이라면 비용을 생각해서 사용하지 않겠습니다.\nAmazon Linux AMI는 EC2에서 편하게 사용할 수 있도록 지원하고 관리하는 리눅스 이미지입니다.\n만일 학생용 크레딧이 있다면 <strong>t2.medium</strong> 인스턴스를 추천합니다.</p>\n<p>먼저, JAVA JDK와 Hadoop 파일을 받겠습니다. 실습 환경은 자바 7, 하둡 1.2 버전입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">sudo</span> yum update <span class=\"token parameter variable\">-y</span>\n$ <span class=\"token function\">sudo</span> yum <span class=\"token function\">install</span> <span class=\"token parameter variable\">-y</span> java-1.7.0-openjdk-devel\n$ <span class=\"token function\">wget</span> https://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz\n$ <span class=\"token function\">tar</span> xvfz hadoop-1.2.1</code></pre></div>\n<p>그리고 자바 프로젝트를 위해 Maven도 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> http://mirror.navercorp.com/apache/maven/maven-3/3.5.3/binaries/apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">tar</span> xvfs apache-maven-3.5.3-bin.tar.gz\n$ <span class=\"token function\">mv</span> apache-maven-3.5.3/ apache-maven\n$ <span class=\"token function\">sudo</span> <span class=\"token function\">vi</span> /etc/profile.d/maven.sh\n\n<span class=\"token comment\"># Apache Maven Environment Variables</span>\n<span class=\"token comment\"># MAVEN_HOME for Maven 1 - M2_HOME for Maven 2</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">M2_HOME</span><span class=\"token operator\">=</span>/home/ec2-user/apache-maven\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\"><span class=\"token environment constant\">PATH</span></span><span class=\"token operator\">=</span><span class=\"token variable\">${M2_HOME}</span>/bin:<span class=\"token variable\">${<span class=\"token environment constant\">PATH</span>}</span>\n\n$ <span class=\"token function\">chmod</span> +x maven.sh\n$ <span class=\"token builtin class-name\">source</span> /etc/profile.d/maven.sh</code></pre></div>\n<p>정상적으로 설치가 되었다면 아래의 명령어에 대한 결과가 나옵니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">java</span> <span class=\"token parameter variable\">--version</span>\n$ mvn <span class=\"token parameter variable\">--version</span></code></pre></div>\n<br>\n<h2 id=\"hadoop-환경-구축\" style=\"position:relative;\"><a href=\"#hadoop-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95\" aria-label=\"hadoop 환경 구축 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop 환경 구축</h2>\n<p>실습환경은 <strong>Pseudo-Distibuted</strong> 모드로 진행합니다.\n먼저 Password less SSH Login을 설정해주어야 합니다.\n그리고 편의를 위해 hadoop-1.2.1 폴더에 Symbolic link를 생성하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># ssh login setting</span>\n$ ssh-keygen <span class=\"token parameter variable\">-t</span> rsa <span class=\"token parameter variable\">-P</span> <span class=\"token string\">\"\"</span>\n$ <span class=\"token function\">cat</span> /home/ec2-user/.ssh/id_rsa.pub <span class=\"token operator\">>></span> /home/ec2-user/.ssh/authorized_keys\n\n<span class=\"token comment\"># symbolic link</span>\n$ <span class=\"token function\">ln</span> <span class=\"token parameter variable\">-s</span> hadoop-1.2.1 hadoop</code></pre></div>\n<p>이제 HDFS와 MR 실행을 위해 설정파일을 수정해줍니다.\n먼저 <code class=\"language-text\">hadoop-env.sh</code>을 열어 <code class=\"language-text\">JAVA_HOME</code> 환경변수를 지정해줍니다.\n가상분산모드에서는 masters, slaves 파일을 수정할 필요가 없습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> hadoop\n$ <span class=\"token function\">vi</span> conf/hadoop-env.sh\n\n<span class=\"token comment\"># set JAVA_HOME in this file, so that it is correctly defined on</span>\n<span class=\"token comment\"># remote nodes.</span>\n\n<span class=\"token comment\"># The java implementation to use. Required.</span>\n<span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">JAVA_HOME</span><span class=\"token operator\">=</span>/usr/lib/jvm/java-1.7.0\n\n<span class=\"token comment\"># Extra Java CLASSPATH elements.  Optional.</span>\n<span class=\"token comment\"># export HADOOP_CLASSPATH=</span></code></pre></div>\n<p>이제 <code class=\"language-text\">core-site.xml</code> 파일을 아래와 같이 수정해줍니다.\nHDFS 데이터 파일들은 홈 디렉토리의 hadoop-data 폴더에 저장하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/core-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>fs.default.name<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>hdfs://localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">0</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>hadoop.tmp.dir<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>/home/ec2-user/hadoop-data/<span class=\"token operator\">&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">hdfs-site.xml</code> 파일도 수정해줍니다.\ndfs.replication 프로퍼티는 복제 개수를 의미합니다.\n일반적으로 복제 개수를 3으로 두는 것을 권장하지만,\n실습에서는 Fully-Distributed 모드가 아니기 때문에 1로 설정하겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/hdfs-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>dfs.replication<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span><span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<p><code class=\"language-text\">mapred-site.xml</code> 파일도 수정해줍니다.\nmapred.job.tracker 프로퍼티는 job tracker가 동작하는 서버를 말합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">vi</span> conf/mapred-site.xml\n\n<span class=\"token operator\">&lt;</span>configuration<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>property<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>name<span class=\"token operator\">></span>mapred.job.tracker<span class=\"token operator\">&lt;</span>/name<span class=\"token operator\">></span>\n        <span class=\"token operator\">&lt;</span>value<span class=\"token operator\">></span>localhost:900<span class=\"token operator\"><span class=\"token file-descriptor important\">1</span>&lt;</span>/value<span class=\"token operator\">></span>\n    <span class=\"token operator\">&lt;</span>/property<span class=\"token operator\">></span>\n<span class=\"token operator\">&lt;</span>/configuration<span class=\"token operator\">></span></code></pre></div>\n<br>\n<h2 id=\"hadoop-mr\" style=\"position:relative;\"><a href=\"#hadoop-mr\" aria-label=\"hadoop mr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hadoop MR</h2>\n<p>이제 NameNode를 초기화하고 하둡과 관련된 모든 데몬을 실행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/hadoop namenode-format\n./bin/start-all.sh</code></pre></div>\n<p>jps를 통해 자바 프로세스가 제대로 실행되었는지 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jps\n3368 TaskTracker\n2991 DataNode\n3241 JobTracker\n3480 Jps\n2872 NameNode\n3139 SecondaryNameNode</code></pre></div>\n<p>HDFS 웹 인터페이스 주소는 <a href=\"http://localhost:50070\">http://localhost:50070</a> 이며,\nMapReduce 웹 인터페이스 주소는 <a href=\"http://localhost:50030\">http://localhost:50030</a> 입니다.\n들어가시면 아래와 같은 화면이 나타납니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.833333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAVNQTFRF7+/v6enp6urq5+fn7e3t5eXl8fHx7ezt7Ozs9vb2/v7+/f39293y3+Hy39/f09PT19fX4uLi1dXV0NDQ2dnZz8/P0tLS3t7e29vb////2tra3Nzc3dzd7u7v9fX19PT09fX2+fn51NPT3t3e2trb6+vr6+vs+/v70NHRv76/1dTV2NfY8PDw8vLy5ubl3d3d6urr+fj5/Pz80M/P1tXW2NjZy8vL2NjYxsbHxMPD3d3e4eDg6Ojo5OTk3+Dg5ubm4eHh4+Pj4uLj8/Pz4+Li4uHh2dna0tLT1NTU1tbWz87O4eLi0dLSz8/Q4ODg1dTU29rbzs7P0tHRzczN3Nvb19fY6+vv7u7u6enq5ufu7u/12NjX0dHS0dHR9/j43d7e3t3d29zc2tvl2drr5ebo5ebq6Onp0dDR1NTV7Ozt7u3u7Ovr9/f38fLy+vr69/f45+fouvQj0AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKWrZtDgAAAFKSURBVBgZjcFXQ4JQFADgc4GQEyVDFK+WRWpTomjYuKYt08p2oU3be/z/p3qvgO8DIAQIB7zQQUSBcCQiYecvclc3RBVVU/SYETcSiqkaelIV6F8gle7pzfT1WzQADMSyOTM/KA5Z1BcMj6ijYwXbFm3qC8adiUk3mAzpqdS0PjNbNIrG3Hx8gf4HxMVBe5HZRLBtTstLpTynMVgqi5Vlpq0U2KoWLa+ZZJ0DTa+aG7WoXjeKC5tbxnZyvbFjDu8KsT1hP1k+0JcP2dExO+SBQ2SIDPEEPAQPkSEyxCZiE5Hw2MLeU2yhCG44Mpw1EucX9cQlDQClq9QO3662r9sZ6gdubr1sejoiAAD1A3f3jHEP0o8+14cMubry+KRPPb9IUsR7faP/gXc7Ax9uIBlWzKvqJw0GTomGAmi9WW4wGZyao9MQoPJFQ/kGj7h1fYjYzuQAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTgvTAVBAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"webint\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/4wBkdSrwvt01XDkBr28SUk/f199d753b8ce9ee2140778f2115d65d4/webint.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 기본으로 설치되어 있는 WordCount 예제를 실행시켜보겠습니다.\n먼저 WordCount 예제의 input 데이터를 HDFS에 업로드하고 jar 파일과 output 경로를 지정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-put</span> conf/hadoop-env.sh ./hadoop-env.sh\n$ ./bin/hadoop jar hadoop-examples-1.2.1.jar wordcount hadoop-env.sh output</code></pre></div>\n<p>HDFS에 write한 결과는 HDFS의 output 경로에서 확인하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ ./bin/hadoop fs <span class=\"token parameter variable\">-ls</span> output\n$ ./bin/hadoop fs <span class=\"token parameter variable\">-cat</span> output/part-r-00000</code></pre></div>\n<br>\n<h2 id=\"intellij\" style=\"position:relative;\"><a href=\"#intellij\" aria-label=\"intellij permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>IntelliJ</h2>\n<p>이번엔 예제가 아니라 Hadoop MR 어플리케이션 프로젝트를 새로 생성해보겠습니다.\nIntelliJ에서 JAVA, maven 프로젝트를 생성하시면 됩니다.</p>\n<p>그리고 pom.xml은 아래와 같이 수정해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"xml\"><pre class=\"language-xml\"><code class=\"language-xml\"><span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.swalloow.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.0-SNAPSHOT<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n\n<span class=\"token comment\">&lt;!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core --></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependencies</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>dependency</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>groupId</span><span class=\"token punctuation\">></span></span>org.apache.hadoop<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>groupId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>artifactId</span><span class=\"token punctuation\">></span></span>hadoop-core<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>artifactId</span><span class=\"token punctuation\">></span></span>\n        <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;</span>version</span><span class=\"token punctuation\">></span></span>1.2.1<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>version</span><span class=\"token punctuation\">></span></span>\n    <span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependency</span><span class=\"token punctuation\">></span></span>\n<span class=\"token tag\"><span class=\"token tag\"><span class=\"token punctuation\">&lt;/</span>dependencies</span><span class=\"token punctuation\">></span></span></code></pre></div>\n<p>Mapper와 Reducer 클래스를 수정한 다음, <code class=\"language-text\">mvn packages</code> 명령어를 통해 jar 파일을 생성합니다.\n그리고 input 파일을 이전과 동일하게 HDFS에 추가하고 생성한 jar 파일을 통해 MR job을 실행시키시면 됩니다.</p>\n<p>아래 링크는 코인 거래 데이터를 입력받아 이동평균선(SMA) 추세를 계산해주는 간단한 예시 프로젝트입니다. 템플릿은 자유롭게 참고하셔도 됩니다!</p>\n<p><a href=\"https://github.com/Swalloow/hadoop-mr-project\">https://github.com/Swalloow/hadoop-mr-project</a></p>\n<br>","excerpt":"…"}}},{"id":"84dea44b-1c73-5776-aa79-b66ff03e2bc0","title":"Why Kubeflow in your Infrastructure?","slug":"why-kubeflow","publishDate":"March 09, 2019","publishDateISO":"2019-03-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 35.03503503503504%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAABKVBMVEX////o7/3E1/v8/f/p8P60zPrV4/yxy/o5evLF2PvY5fzS4fykwvmpxfl3pPZFgvN5pfZ1o/aYuvidvflEgfNyoPZglPWWuPhKhfM9ffJBgPNdkvRakPRQivSKsfdSi/Rkl/VYj/RAf/JHhPNUjPRbkfRXjvROiPNDgPNEgvNJhfNKhvNGg/NBf/JDgfM8fPJckfRZj/RQifNCgPNLhvNMh/N2o/Z4pPasucy8pWusmmvDtY2VuPiPtPifv/mau/hTi/Te6f3a5v3s8v57pvZqm/W/vLDUmRG4hRDgskhVjfRzofb1+P660fpxoPaKsPeFrfeXufjq8f6vyfpomvU+fvI/fvJWjfRilfVflPU9fPJNh/Ph6/21zfrC1vvG2fvK3PzR4Pz5+/9pAKfEAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMnjWGZPwAAAQtJREFUKM910GdXwjAUgOE4gAuOUgW0NIAptGrQVlBxD1woblHc8///CJObKAcOfT70NMnb5DSEhBsYREP91oYjUlQNYoDicipBRkalMR3GcWncQEkVmvIxQSZxkEpn0BTAtCWWsjY1VNEb5tRkHgozzDHBoKz4H5Zcb7YTzs3z8oIIF30/MGGJ2rR3xyzLVKqp3PIKX+UilGoOWgO/4oUcvb6xubW9s4v/HtlzGLP3oX4gHP6FR8fopHF6xqHo0moT4Fx9fKEuRIeXJe2KXNeUm9uu8C4qJVqgueTeCR7agWWlY12h1hLniWt4lCFvek/PXjks7OwI8PLaBugfvr1rH+RTv31959EPBr/dtDCUhk0EDAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"dept\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/3S0qsh5X6Nue7f5ZBPzUCj/ce6ae1e6ba020a4e7048c5df7224fe21/dept.png?w=999 999w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML 모델링 보다 이외의 작업들이 많이 필요합니다. 특히 서비스의 여러 기능에 ML을 적용시키려 하는 경우, 이러한 파이프라인이 복잡해지고 유지보수가 힘든 방향으로 가는 경우가 많습니다. 이러한 이유로 규모있는 IT 서비스 회사들은 공통의 ML 플랫폼을 구축하곤 합니다.</p>\n<p>앞으로 소개하려는 Kubeflow는 Kubernetes를 기반으로 하는 오픈소스 ML Toolkit 입니다. 아직 버전이 낮아 production 환경에서 사용하는 곳이 많지 않지만 미리 알아두면 좋을 것 같아 컴포넌트들을 하나씩 분석해보려 합니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"why-kubeflow\" style=\"position:relative;\"><a href=\"#why-kubeflow\" aria-label=\"why kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Why Kubeflow?</h2>\n<p>이미 기존의 인프라를 기반으로 자동화된 ML Workflow가 구축되어 있다면, 굳이 Kubeflow로 옮길 필요는 없습니다. 하지만 아래와 같은 상황을 가진 팀이라면 Kubeflow는 좋은 선택지가 될 수 있습니다.</p>\n<ul>\n<li>이미 Kubernetes 기반의 인프라를 사용하고 있으며, ML 인프라를 구축하려는 경우</li>\n<li>서비스를 On-premise, Multi-cloud 환경에 배포해야 하는 경우</li>\n<li>Scalable ML이 필수적이며, 기존의 여러 ML 서비스를 쉽게 배포하고 리소스 관리 비용을 줄이려는 경우</li>\n<li>Research Engineer, Data Scientist 를 위한 인프라 관리의 복잡성을 최소화하고 일관된 인터페이스를 제공하여 몇 번의 클릭만으로 설정을 쉽게 하고 싶은 경우</li>\n</ul>\n<br>\n<h2 id=\"consistency-in-infrastructure\" style=\"position:relative;\"><a href=\"#consistency-in-infrastructure\" aria-label=\"consistency in infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Consistency in Infrastructure</h2>\n<p>Kubeflow는 Kubernetes 기반의 인프라가 가지는 장점을 그대로 가지고 있습니다. 각 서비스에 대한 Monitoring, Health Check, Replication 등의 기본 요구사항을 갖추고 있으며 쉬운 배포 환경을 제공합니다. 이외에도 아래와 같은 usecase에서 활용될 수 있습니다.</p>\n<ul>\n<li>Research Engineer들이 인프라가 아닌 모델링에만 집중할 수 있는 환경을 제공할 수 있습니다. 모두가 Docker 기반의 추상화된 환경에서 연구를 할 수 있으며, 동일한 데이터, 연구 결과를 공유할 수 있습니다. 가상화된 GPU 환경에서 모델을 분산 학습시킬 수 있으며, TensorFlow, PyTorch, MXNet 등 다양한 프레임워크 환경을 지원할 수 있습니다.</li>\n<li>Kubeflow는 end-to-end를 제공하기 때문에 ML 프로젝트를 production에 반영하는 과정이 단순해집니다. 지속적인 데이터 파이프라인을 구축하여 <strong>argo</strong>를 통해 모델을 업데이트 하고, <strong>seldon</strong>을 통해 production 환경을 테스트해 볼 수 있습니다.</li>\n<li><strong>Katib</strong>을 통해 Hyper parameter tuning 과정을 쉽게 자동화 할 수 있습니다. <strong>Katib</strong>에서 제공하는 인터페이스를 통해 여러 어플리케이션으로 확장시킬 수 있으며, 튜닝 결과를 지속적으로 기록하고 공유할 수 있습니다.</li>\n</ul>\n<br>\n<h2 id=\"resource-utilization-by-the-training--serving-modules\" style=\"position:relative;\"><a href=\"#resource-utilization-by-the-training--serving-modules\" aria-label=\"resource utilization by the training  serving modules permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Resource utilization by the Training / Serving modules</h2>\n<p>테스트 환경을 쉽게 구축할 수 있으며, 클라우드 비용을 최적화시킬 수 있습니다. K8S 클러스터는 동일한 인스턴스에 여러 Pod을 실행시킬 수 있습니다. 따라서, 사용하는 리소스를 팀 또는 프로젝트 단위로 namespace를 분리시켜 리소스 사용량을 모니터링 할 수 있습니다.</p>\n<p>일반적인 클라우드 인프라 환경을 서비스 라이프사이클과 연계되어 있지 않기 때문에 training job이 끝난 이후에도 인스턴스가 켜져 있기 때문에 그에 대한 비용을 지불해야 합니다. 하지만 Kubeflow를 사용하는 경우, 사용량에 따라 클러스터를 auto scaling 한다거나 spot instance로 training job을 실행시킬 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e\">https://medium.com/kubeflow/why-kubeflow-in-your-infrastructure-56b8fabf1f3e</a></li>\n</ul>","excerpt":"실제 ML을 서비스에 적용시키는 일은 위 그림에 나타난 바와 같이 ML…"}}},{"id":"a77d5de0-57d3-56d5-bedc-d02ee85072f7","title":"Amazon EKS에 Kubeflow 구축하기","slug":"eks-kubeflow","publishDate":"March 10, 2019","publishDateISO":"2019-03-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow를 구축하는 방법에 대해 정리해보겠습니다.</p>\n<ul>\n<li><a href=\"http://swalloow.github.io/why-kubeflow\">Why kubeflow in your Infrastructure</a></li>\n<li><a href=\"http://swalloow.github.io/eks-kubeflow\">Amazon EKS에 Kubeflow 구축하기</a></li>\n<li>Kubeflow의 ModelDB</li>\n<li>Kubeflow의 Hyper parameter Tuning (Katib)</li>\n</ul>\n<br>\n<h2 id=\"기본-환경-설치\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EB%B3%B8-%ED%99%98%EA%B2%BD-%EC%84%A4%EC%B9%98\" aria-label=\"기본 환경 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기본 환경 설치</h2>\n<p>Kubeflow를 설치하기 이전에 AWS CLI, Docker가 설치되어 있어야 합니다.\nEKS에서는 최근에 GPU 인스턴스인 P2, P3에 대한 지원을 제공하고 있습니다.\n이를 사용하기 위해 AWS Marketplace에서 <a href=\"https://aws.amazon.com/marketplace/pp/B07GRHFXGM\">EKS-optimized AMI with GPU Support</a>를 구독해주어야 합니다.</p>\n<p>EKS는 Web UI 또는 eksctl이라는 cli 도구를 사용해서 클러스터를 구성할 수 있습니다.\neksctl은 kubectl이나 kops와 유사한 명령어를 제공합니다.\n자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/\">https://aws.amazon.com/ko/blogs/opensource/eksctl-eks-cluster-one-command/</a> 에서 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"eks-클러스터-생성\" style=\"position:relative;\"><a href=\"#eks-%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EC%83%9D%EC%84%B1\" aria-label=\"eks 클러스터 생성 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EKS 클러스터 생성</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install eksctl</span>\n$ brew tap weaveworks/tap\n$ brew <span class=\"token function\">install</span> weaveworks/tap/eksctl\n\n<span class=\"token comment\"># create cluster</span>\n$ eksctl create cluster eks-cpu <span class=\"token punctuation\">\\</span>\n--node-type<span class=\"token operator\">=</span>c4.xlarge <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--timeout</span><span class=\"token operator\">=</span>40m <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--nodes</span><span class=\"token operator\">=</span><span class=\"token number\">2</span> <span class=\"token punctuation\">\\</span>\n<span class=\"token parameter variable\">--region</span><span class=\"token operator\">=</span>ap-northeast-2\n\n<span class=\"token comment\"># NVIDIA driver plugin</span>\nkubectl apply <span class=\"token parameter variable\">-f</span> https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v1.11/nvidia-device-plugin.yml\nkubectl get nodes <span class=\"token string\">\"-o=custom-columns=NAME:.metadata.name,MEMORY:.status.allocatable.memory,CPU:.status.allocatable.cpu,GPU:.status.allocatable.nvidia\\.com/gpu\"</span></code></pre></div>\n<ul>\n<li>먼저 Homebrew로 <code class=\"language-text\">eksctl</code>을 설치합니다. 이후 아래의 명령어를 통해 c4 인스턴스 기반의 EKS 클러스터를 생성하고 Memory, CPU, GPU 정보를 확인해줍니다.</li>\n<li>GPU 인스턴스로 클러스터를 생성하고 싶다면 생성하기 이전에 EC2 Limit 페이지에서 p2 또는 p3 인스턴스의 limit을 확인해야 합니다. 0으로 되어있다면 <code class=\"language-text\">Request limit Increase</code>가 필요합니다.</li>\n<li>GPU-enabled worker를 가지는 EKS 클러스터를 생성한다면 NVIDIA driver plugin을 활성화시키는 과정이 필요합니다.</li>\n<li>Create cluster에서 <code class=\"language-text\">AccessDenied</code> 오류가 발생하는 경우, 사용할 IAM 유저를 생성하고 EKS 관련 permission과 <code class=\"language-text\">AWSCloudFormationReadOnlyAccess</code>를 추가해주어야 합니다. EKS는 현재 기준 1.11 버전을 default로 사용하고 있습니다.</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.9%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABjFBMVEXx8/Pw8vPx8vLx8vPy8/Pr7/Hg6e7u8PDX4+vf6O7v8PDl6Ojm6enw8fHz9PTl5ua7vb3Nzs/AwcHk5ubh4+T29/fq7e3v8fHt7+/w8vLt7/D4+fnu7/DZ2tzp6uvz8/P29vb09PTv7/D19fX6+vrq6uvR0tLd3t7X19fP0NDW1tb6+/v5+fn5+fr+/v75+vr8/Pz9/v77+/v9/f3y8vPl5ufr7O3w8fL////39/jh4uPt7u/19fby9fLa4tvp8ej4+/jx9/H1+fXg4ePm5+ji4+Xq6+z7+/z29vfg4uPd3+Df4eLa3d7y9PTz9fXf4OHe3+Di4+Pt7e7u7u/t7e3w8PD09PXp6+vj5ebh5OXj5ubo6+vn6uvn6ur7/Pz09fX4+Pjq7Ozh5eXi5ubi5eXi5ebr7u7w8/Pu8PHr7e3t8PDq7O3z8/Tn6Orq6uzo6er6+vvx8fHv7+/u7+/w8PHn5+jk5eXj5OTs7Ozu7u7x8fL19vb39/fo6Onh4eHNzc7Ozs/Ly8v8/f3o6eubnh3NAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUDTMnjWGZPwAAAZxJREFUKM+VkvdTwjAUgGOpotUGVxVnQykuao3gqHtXFHFBUakD98KBE/f6x00Zp+eh4PdL3nv57iV5FwByKBNN0RkBuXnm/AKmsCij+PsWxbIwAcOyFLAUl5SWpRWZcoqrqLRWVdfU1tUzRkeWzgJA88iGBDsv/g0RHQ2NTc1NLSiTCJ1SqyTKBCfXJmEjaHdJbvkHEMCOzq5uQSH09FJ9/UYgDwwOKT8gIsbJGNtS1eGR0TSikhVEZMbGJ9QOqMjY5cJ40k2O9kxNe73WGZ8PmAAAvlnOZYjU3Nz8gsWx6PcHApomBGVFppaWV0KhwiJdX9X1NUIlR8R1zrOBwuIkjnfERkd6M7SylWB7e2drd3dvP/0dnbD74FDXD61H5iNzha4f+9r+85jI+EnkNDXXeFFG6pl6TtZknhTtmhaNaheXfj/DMHS8enV9cxuLaRd3wn2UYENxUbITbHAjGLQ/PDwmxCfLTSzA83ykHxHCj4ZogllhAnQ4K8g3e355fZNEMeN/hO5vvP+aQIAinq9pyX31+CtR1Q8hlaBPkOylZOzG0MEAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-eks\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pImEHgxFKvmlQD8madTVs/299c082039afd357181c8abdcee801d3/eks.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>EKS 메뉴에 가보시면 EC2 인스턴스, 네트워크 설정이 완료된 것을 확인하실 수 있습니다.\nAWS CloudFormation에서 cluster와 node-group에 대한 stack이 생성됩니다.</p>\n<p>K8S 대시보드는 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/dashboard-tutorial.html\">AWS EKS 공식 문서</a>를 참고하여 띄울 수 있습니다.</p>\n<br>\n<h2 id=\"ksonnet을-이용한-kubeflow-설치\" style=\"position:relative;\"><a href=\"#ksonnet%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-kubeflow-%EC%84%A4%EC%B9%98\" aria-label=\"ksonnet을 이용한 kubeflow 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>ksonnet을 이용한 KubeFlow 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\"><span class=\"token comment\"># install ksonnet</span>\n$ brew <span class=\"token function\">install</span> ksonnet/tap/ks\n$ ks version\nksonnet version: <span class=\"token number\">0.13</span>.1\njsonnet version: v0.11.2\nclient-go version: kubernetes-1.10.4\n\n<span class=\"token comment\"># install kubeflow</span>\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_TAG</span><span class=\"token operator\">=</span>v0.4.1\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KUBEFLOW_SRC</span><span class=\"token operator\">=</span>/tmp/kubeflow_src\n$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">KFAPP</span><span class=\"token operator\">=</span>eks-kubeflow\n\n$ <span class=\"token function\">mkdir</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span> <span class=\"token operator\">&amp;&amp;</span> <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>\n$ <span class=\"token function\">curl</span> https://raw.githubusercontent.com/kubeflow/kubeflow/<span class=\"token variable\">${KUBEFLOW_TAG}</span>/scripts/download.sh <span class=\"token operator\">|</span> <span class=\"token function\">bash</span>\n\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh init <span class=\"token variable\">${KFAPP}</span> <span class=\"token parameter variable\">--platform</span> none\n$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh generate k8s\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh apply k8s</code></pre></div>\n<p>ksonnet으로 KubeFlow를 설치하기 이전에 먼저 Homebrew로 ksonnet을 설치합니다.</p>\n<br>\n<h2 id=\"kubeflow\" style=\"position:relative;\"><a href=\"#kubeflow\" aria-label=\"kubeflow permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeFlow</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.400000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABU1BMVEXj6vrT3ffd5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6FoemEn+mJo+mIoumHoumCneR/muKBnONZfN1df95Xe91fgd5Wet1SdtxSd9zm5ubs7Ozt7e3z8/P29vbw8PDh4eHi4uLy8vL4+Pj09PTq6ur5+fn6+vr+/v78/Pz39/fr6+vn7eXy9vT29/z3+Pz19/zz9fz8/P7x8fHv7+/7+/vt8ez3+fj4+f36+/37+/36+v35+v39/f3Z2dnc5tns8e/v8vvw8/z6+/7n5+fw8vv19vzo6Oj6+/r8/f77/P7l5eXv9PLy9Pv3+P3d3d3s8u/v8vzy9fzw8vz19/3j4+P19fXg6N7t8vDx8/vu8fvw8/D8/PvV1+DY2uDe59zr8O/v8fvz9fv08/Te3t709v3z9vX2+Pz09vz2+Pfr8e/x9PySsnGdAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAe5JREFUKM+FUll7k0AUHRdGKSVuVetKGCAsM0OIJBioXcDamhhrxJ1o3JdoXf7/k3cmsfn8qu3h4T7M+c4591wQOnL02HFFAJ84qS78DU0+LOo1dAqdPnP23JLE+Qv7cHFpD2h5+dLlK1evHYbrCBt1E2NMrINhI+w0DEF0lYPg+UBcCIBImcVnCJkclhysyX0PJkFmEESmiVs34nbcSeKb8Obadjf1LPHOM85hWhlBkVEHQbxya3VtbX0jrwHRjALGCiYVC3AAekEQvt0QzM07yVaib+v6XcULej2XMNcX4TJFsRTFZQRpmhAUxKSf3BMitK5pdkpdf2YN4QVxoEriyn3Od9YfSGKkDezUK/jMGrhMWA9Fjbj1MCnheyQW7dop5CJ/FOl0GfxYLrP5JHn6TH+uv4DOjKph25SMZhmbikIy6FF1BPHlq7Jf9sfj8nVJ3VTUM83IZEYCGfF0mTdveW1WOB0Mhz5hvOB7KCCj9u69qqrRh4/lp/HnXBKxGTVZ6H6ZK4qt8WQ4zah/1bcX5V17VfWvjBPHgb+i9a0dt3c73+MObI3tLt53QtxwItHjj3w3X4UvhxPWgywrKJ2fkIYEBaozqcD6569E72/tCGvN6HXd+QlHwlooCkFM+X8wcsMwzDwgVrIe8zD8BgxTfs3FCoDfAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE5WEs11wAAABt0RVh0aWNjOmRlc2NyaXB0aW9uAE5pZ2h0IFNoaWZ0Un2GygAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/5pBSaBwBsrDxrokgg8dG6W/953dfc56fe406e04893d3b8ad375fe55/kubeflow-pod.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAABGlBMVEXj6vrT3ffc5Pni6Prh6Pr////u7u7c3Nzb29vg4ODk5OTp6en5+v7y9Pz9/f74+v6GoemFoOmKpOqJo+mIo+mJpOqEnuWBm+KCneNXe95Ye95afd5Vet1cf95ihN9oiOBjhN9PdNxPddzm5ubf39/u7e3y8vL19fXw8PDi4uLz8/Ps7Ozn5+f4+Pj09PT6+vr29vb+/v739/f7+/v8/Pz5+fnq6urZ2+LX2eLa3OLr6+vo7uf1+Pb3+f319/z9/f37+/35+v3t7e3l5eXs8Or09/b3+P36+/34+f35+frh4eHo6Ojc5tns8e/y9fzx9Pzx8/z09v3c5trr8e7x8/vv7+/2+Pzw8/vy9Pvx8fHa2trj4+PZ2dne3t7S9yBgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAThJREFUKM+tj2tPwjAUho+XFRHv837X4cY6uu10HSo6p0NRmXdBReT//w07jCZGJf3gk7xJc/rk7SnAwODQsJZBciP50e8Uehdj4xMwCVPTM7quz87p+vzCDxb1L2BpeWV1bX1jc6s/22AUyY7EtPpTAmLbREKdssG0P2EuECPzCPN89Bgipcz10UfkHANKAyqQhijnUNnd27ft6sFhdBTLiW95PMbQw+PoRASYwWUEhaTmSMjpWVTPRMsPuUAW4Hn94lL0xPBDJHYjlU9fXd/cxpaGhPgloblMi+7umaeh3M+UCVyo1qpJkpCHx2ZTuBgnidUKkHJ8en7hYa+xLePJxteOIxtb5q+0Pw8tILJOBSgUlDwCaV5RJA3nv8ViQ1Esq+6YU218K9ZSJbHbTVW+AxW70zEUxHfY702Jn8O0FgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeflow-pvc\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/1JOgEjXtq6dzBWzDa7FvoG/48fd50788711879a7029fea56d9c0a63/kubeflow-pvc.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>KubeFlow를 설치하고 나면 Pods, Deployment, Service, ConfigMap 등 모든 컴포넌트들이 자동으로 배포됩니다. default로 PVC는 EBS gp2 볼륨이 설정된 것을 확인하실 수 있습니다.</p>\n<p>EKS에서는 IAM 기반의 RBAC 인증을 사용합니다.\n아래의 명령어를 통해 EKS의 JupyterHub를 로컬의 8080 포트로 포워딩해서 접속하실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ kubectl port-forward svc/jupyter-lb <span class=\"token parameter variable\">-n</span> kubeflow <span class=\"token number\">8080</span>:80</code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.900000000000006%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAJ82lDQ1BpY2MAAEiJlZYHVBTXGsfvzPZGW1g6LL33toD03qRXUVkWWLqwVBEbEoyAooiIgCJoqApGQ5GgAqJYCAIK2LNIEFBisAAqKm8WTEzeO+e98/7nfPP95s6db765d86ZPwAkL2ZSUjwsAEBCYirHx8mWHhQcQsdNAhhgAT8wBBQmKyXJxsvLHSD6M/9Ti2MA4uW7Wrxa/3n9v0owIjKFBQDkhXBURAorAeEOhPVZSZxUhOcQVshITUKY1yUQ5iANIqzIY/YaM3gcvsbuq3P8fOwQDgMAT2YyOWwAiLy+6OksNlKHWIiwbmJETCLCXQhbsqKZEQh/QlgzIWELwiRVhFXD/1aH/Y+a4X/VZDLZf/Hau6yKvD6GHZ1K942OiUr9P5fkfyshPu3P5/BWnhy3xc0HyTQkpMB6EAPYIBqkAjrwRXIMiEIYpEZmrjZityVpK2e1NxtktyLpLoksbU26vq6eKQC8vV8ru3jv657afBvb/ytydzqPvo3ZeQLQcgRZr/hvY0r1SEuLAPT3sNI46WtjaN4BA4jINyUMxIEMUACqQAvoA2NgDqyBA3AFnsAPBINNgIX0nAA4IANkg90gDxSAg+AIKAdV4BSoB2fBedAOukAPuA5ugyEwCh4BLpgCL8E8WATLEAThIApEhcQhWUgJ0oD0IQZkCTlA7pAPFAyFQWwoEUqDsqE9UAFUDJVD1VAD9CN0EeqBbkLD0ANoApqF3kAfYRRMhoVhaVgZ1oEZsA3sBvvBG2E2nAxnwbnwAbgMroHPwG1wD3wbHoW58Et4AQVQJBQNJYfSQjFQdihPVAgqCsVB7UDlo0pRNahmVCeqH3UXxUXNoT6gsWgqmo7WQpujndH+aBY6Gb0DXYguR9ej29B96LvoCfQ8+guGgpHCaGDMMC6YIAwbk4HJw5RiajGtmGuYUcwUZhGLxdKwKlgTrDM2GBuL3YYtxB7HtmC7scPYSewCDocTx2ngLHCeOCYuFZeHO4Y7g7uCG8FN4d7jSXhZvD7eER+CT8Tn4EvxjfjL+BH8NH6ZIEBQIpgRPAkRhK2EIsJpQifhDmGKsEwUJKoQLYh+xFjibmIZsZl4jfiY+JZEIsmTTEnepBjSLlIZ6RzpBmmC9IEsRFYn25FDyWnkA+Q6cjf5AfkthUJRplhTQiiplAOUBspVylPKez4qnzafC18E306+Cr42vhG+V/wEfiV+G/5N/Fn8pfwX+O/wzwkQBJQF7ASYAjsEKgQuCowLLAhSBfUEPQUTBAsFGwVvCs4I4YSUhRyEIoRyhU4JXRWapKKoClQ7Kou6h3qaeo06JYwVVhF2EY4VLhA+KzwoPC8iJGIoEiCSKVIhckmES0PRlGkutHhaEe08bYz2UVRa1EY0UnSfaLPoiOiSmKSYtVikWL5Yi9io2EdxuriDeJz4IfF28ScSaAl1CW+JDIkTEtck5iSFJc0lWZL5kuclH0rBUupSPlLbpE5JDUgtSMtIO0knSR+Tvio9J0OTsZaJlSmRuSwzK0uVtZSNkS2RvSL7gi5Ct6HH08voffR5OSk5Z7k0uWq5QblleRV5f/kc+Rb5JwpEBYZClEKJQq/CvKKsooditmKT4kMlghJDKVrpqFK/0pKyinKg8l7lduUZFTEVF5UslSaVx6oUVSvVZNUa1XtqWDWGWpzacbUhdVjdSD1avUL9jgasYawRo3FcY1gTo2mqmahZozmuRday0UrXatKa0KZpu2vnaLdrv9JR1AnROaTTr/NF10g3Xve07iM9IT1XvRy9Tr03+ur6LP0K/XsGFANHg50GHQavDTUMIw1PGN43ohp5GO016jX6bGxizDFuNp41UTQJM6k0GWcIM7wYhYwbphhTW9Odpl2mH8yMzVLNzpv9Ya5lHmfeaD6zTmVd5LrT6yYt5C2YFtUWXEu6ZZjlSUuulZwV06rG6pm1gnWEda31tI2aTazNGZtXtrq2HNtW2yU7M7vtdt32KHsn+3z7QQchB3+HcoenjvKObMcmx3knI6dtTt3OGGc350PO4y7SLiyXBpd5VxPX7a59bmQ3X7dyt2fu6u4c904P2MPV47DH4/VK6xPXt3sCTxfPw55PvFS8kr1+9sZ6e3lXeD/30fPJ9un3pfpu9m30XfSz9Svye+Sv6p/m3xvAHxAa0BCwFGgfWBzIDdIJ2h50O1giOCa4IwQXEhBSG7KwwWHDkQ1ToUaheaFjG1U2Zm68uUliU/ymS5v5NzM3XwjDhAWGNYZ9Ynoya5gL4S7hleHzLDvWUdbLCOuIkojZSIvI4sjpKIuo4qgZtgX7MHs22iq6NHouxi6mPOZ1rHNsVexSnGdcXdxKfGB8SwI+ISzhYqJQYlxi3xaZLZlbhpM0kvKSuMlmyUeS5zlunNoUKGVjSkeqMPKTHUhTTfsubSLdMr0i/X1GQMaFTMHMxMyBrepb922dznLM+mEbehtrW2+2XPbu7IntNturd0A7wnf07lTYmbtzapfTrvrdxN1xu3/J0c0pznm3J3BPZ6507q7cye+cvmvK48vj5I3vNd9b9T36+5jvB/cZ7Du270t+RP6tAt2C0oJPhazCW/v19pftXzkQdWCwyLjoxEHswcSDY4esDtUXCxZnFU8e9jjcVkIvyS95d2TzkZulhqVVR4lH045yy9zLOo4pHjt47FN5dPlohW1FS6VU5b7KpeMRx0dOWJ9orpKuKqj6eDLm5P1qp+q2GuWa0lPYU+mnnp8OON3/A+OHhlqJ2oLaz3WJddx6n/q+BpOGhkapxqImuCmtafZM6Jmhs/ZnO5q1mqtbaC0F58C5tHMvfgz7cey82/neC4wLzT8p/VTZSm3Nb4PatrbNt0e3czuCO4Yvul7s7TTvbP1Z++e6Lrmuiksil4ouEy/nXl65knVloTupe66H3TPZu7n30dWgq/f6vPsGr7ldu3Hd8frVfpv+KzcsbnTdNLt58RbjVvtt49ttA0YDrb8Y/dI6aDzYdsfkTseQ6VDn8LrhyyNWIz137e9ev+dy7/bo+tHhMf+x++Oh49z7EfdnHsQ/eP0w/eHyo12PMY/znwg8KX0q9bTmV7VfW7jG3EsT9hMDz3yfPZpkTb78LeW3T1O5zynPS6dlpxtm9Ge6Zh1nh15seDH1Munl8lze74K/V75SffXTH9Z/DMwHzU+95rxeeVP4Vvxt3TvDd70LXgtPFxMWl5fy34u/r//A+ND/MfDj9HLGJ9ynss9qnzu/uH15vJKwspLE5DBXrQAKCTgqCoA3dQBQggGgDiH+acOaN/vqaaC/uZs/GbyifuORuTX/tipjAM7uAsAHCbtuAM4hoYwwxRoAnq30swawgcFf8VUpUQb6X5/BMyfwysoKz//BAKys6us03vn0mifkCYt40JOGqx3Qkt7/uy/7F9F1u0k0AodUAAAAmVBMVEXy6+bk5OTg4ODx8fH39/f29vb9/f3////vvp7stZDssYvrsInuu5ntuJbttZHqqoHpqH7ss4/8/Pfq6Nvu7N7t6t3s6tzt697t69349ef8+/be3Mzf3Mzd28ve28ve3Mvc2sr49ePn5dTn5NP59uP59uT69+T7+OX09PTm5ubt7e3+/v77+/vl5eX8/Pz9/fz02srjj1rrspCrfuCMAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMnjWGZPwAAAHtJREFUKM9jZGAEAgaCgJGRjYE4wMJIpEImBmorZMFwNNRrjL/xK2QlQeF/JpCxPwlYzQFSxPiPmZHxK36FDOxAdf+JMJEP5sY3jPgVstyCMtRu4w/HP+oq2CXQ+WxMd4iLGSYmHbC/GW+gxwQ7Kv8/QoZAFNIv9QygQgBHfg97eDfy7wAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOVhLNdcAAAAbdEVYdGljYzpkZXNjcmlwdGlvbgBOaWdodCBTaGlmdFJ9hsoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=250 250w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/59WRGFFpwcKqJcUN1t6Vez/0145c0b7fb92f5bf79380380777c6ab7/jupyter.png?w=1000 1000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 설치하고 난 이후에 KubeFlow 문서의 git summerization 튜토리얼을 그대로 따라하실 수 있습니다. 모든 컴포넌트가 자동으로 배포되다 보니 생략하고 넘어가는 경우가 많은데 production 환경에서 사용하려면 각 설정 YAML 파일을 내 환경에 맞도록 수정할 필요가 있습니다. 삭제는 아래의 명령어를 통해 실행시키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">cd</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/<span class=\"token variable\">${KFAPP}</span>\n$ <span class=\"token function\">sh</span> <span class=\"token variable\">${KUBEFLOW_SRC}</span>/scripts/kfctl.sh delete k8s</code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/\">https://aws.amazon.com/ko/blogs/opensource/kubeflow-amazon-eks/</a></li>\n<li><a href=\"https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md\">https://github.com/aws-samples/machine-learning-using-k8s/blob/master/kubeflow.md</a></li>\n<li><a href=\"https://eksctl.io/\">https://eksctl.io/</a></li>\n</ul>\n<br>","excerpt":"AWS EKS는 Fully managed K8S 서비스 입니다. 이번 글에서는 EKS 환경에 Kubeflow…"}}},{"id":"a73decb2-8523-53c8-9b48-c654959c3da1","title":"Airflow on Kubernetes (2)","slug":"airflow-on-kubernetes-2","publishDate":"July 12, 2020","publishDateISO":"2020-07-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>지난 글에서는 <a href=\"https://github.com/helm/charts/tree/master/stable/airflow\">stable/airflow</a> helm chart를 이용하여 CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식에 대해 설명하였습니다. 이번 글에서는 많이 사용하는 Airflow Helm Chart에 대해 알아보고 최근에 추가된 <strong>Official Airflow Helm Chart</strong>를 이용하여 KubernetesExecutor를 배포했을 때 어떤 아키텍쳐를 가지는지에 대해 설명드리려 합니다. 먼저 많이 사용하는 차트는 아래와 같이 3가지가 있습니다.</p>\n<br>\n<p><strong>1. stable/airflow</strong>:\n다양한 옵션을 지원하고 많이 사용하지만 커뮤니티 버전입니다.\n공식 릴리즈 이후에 개발이 중단될 예정입니다.</p>\n<p><strong>2. astronomer/airflow-chart</strong>:\nAirflow as a Service를 개발하는 astronomer에서 공개한 차트입니다.\nairflow 2.0의 공식 차트로 활용될 예정입니다. (merge된 상태)</p>\n<p><strong>3. apache/airflow-on-k8s-operator</strong>:\nKubernetes Operator를 활용한 방식으로 위와 다른 구성을 가지고 있습니다.\n구글에서 apache에 기증했으며 GCP의 Composer에서 활용되고 있다고 알려져 있습니다.</p>\n<br>\n<p>이외에도 최근에 공식 차트가 <a href=\"https://github.com/apache/airflow/pull/8777\">PR-8777</a>을 통해 merge 되었습니다.\n아직 정식 릴리즈는 아니지만 큰 이슈는 없는 것으로 보여 공식 차트 기준으로 설명하겠습니다.</p>\n<br>\n<h2 id=\"airflow-executor-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-executor-on-kubernetes\" aria-label=\"airflow executor on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Executor on Kubernetes</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.56972111553785%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAAq1BMVEX////7+/v4+Pj8/Pz+/v7p7/qTrumqwO7//vv49fH29PD18u7//fr6+vrz8/Pi6PWNquiRreift+v8+/n69/P59/P08e36+PP29vaguOyPq+iLqejx9fz19fX09PSSruiJp+fx9Pz5+fnt7e3y8vL9/f3Bz++Ipud8neW3yfDT3vaet+uYsunJ1/Tu7u739/fr6+vx8fH6+/7V3vLw8PDv7+/z8vD//vz///4XpzsXAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAANdJREFUGBmdwYsyw0AABdC7uVcp2XizRVt2s96W0uD/v4wZ0k66GYNz8HumoLA2GKwLHRvDza1hiSVbFTLbO7t7lh37B4dHxyUyxjgnaXRyeoaWQc648WQi2tH0/AItIkfvQi0Bxk8qRV5eXd+AyJGRpADIWkXc3t0/gMjRuJCCsOSrUEhYRWQkI2EV0cM/Biehg+jBSFLQJ7SIHt49SfT1rI7CN6IHOfZSBIgFogd95RQFEAuRPxH+4vklzGGbZMrX1MyTVWpC1Cw1TSjQ6+0dEgDhi/AvH2u9DuzjMVPaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"task lifecycle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=628 628w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=1255 1255w,\nhttps://images.ctfassets.net/tushy4jlcik7/3elcSIiD8oPaLurWJrAgdG/eafa8785a7d101ad8e9d8690383f21f3/task_lifecycle.png?w=2510 2510w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 공식 차트 기준으로 executor마다 컴포넌트가 어떤 형태로 올라가는지 알아보겠습니다.\n컴포넌트는 크게 아래와 같이 구분하고 있으며 위의 그림과 같은 라이프사이클에 따라 동작합니다.</p>\n<ul>\n<li><strong>webserver</strong>: Airflow UI, RBAC, DAG monitoring</li>\n<li><strong>scheduler</strong>: task monitoring, trigger, DAG sync, DAG processing</li>\n<li><strong>executor</strong>: how task instance running (pluggable)</li>\n<li><strong>worker</strong>: task instance processing</li>\n</ul>\n<br>\n<h2 id=\"localexecutor\" style=\"position:relative;\"><a href=\"#localexecutor\" aria-label=\"localexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>LocalExecutor</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABTVBMVEX////U4PqYtfLn7vz5+vuCpe+5zfaVs/H5+fr6+vuJqvB6oO6pwfT8/f/x9f3+/v+mv/SVs/L19/75+v6ivPP7/P7j6/t3nu5rlezA0PLz9PX4+frS3/nQ3PP5+vqZtvGEpuzl6O7p6+7o6+7j5+7y8/WQr/CLquzo6u7n6u7k6O709ffX4euOstbL3vBymetvmOzL1u33+PltluttluzW3u5Xf6UrbrJKi8jh5e5gjet4nu6wxOzw8fP7+/v19fbV3u5nkuxtl+2/zu3y8/Tx8fFfhalTkcvl5+q7yeepvujn6ey3yOmvwuno6u3y9fm70efp8fng4uXMzdDO0NPW2Nvi5OfP0dPNztHd3+Lq6uri4uLj4+P8/Pzz9Pbx8vT7+/zm5ubZ2dnf39/h4eGXtfKWtPLk6/zw8/qQr/G1yvS3y/abt/Le3t76+vq1dLaJAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAQ5JREFUKM9jYCAeMDIxE6WOhZWNnYOFhZOTk4UDTLKgkEgKubh58BiDxOTlYyBKISe/gKAQkpSwCJMokiwSU0xcQlIKCqQZGGTEJWRhXDkUhfzyCopKSsoqSkCgysDAq6auoaSkqQXiaoMV6ujqQVwhBxLTNzCEKGQwAtKKxiamYIUgN5qZWyAUWlpZ2wApWzs7O3sg7eDo5AykXOzs7exc3czdEQo9PL28kUz08PH1g5voHxAI8RdIYVBwSCiSwrDwiEi4G6OiYyAKY+NAIB5EAH3NkBAHB6i+htJ2SGGZmBSTnJKCFo6wsHclGIUQKjUtnZBCYCrhYMmwzswikHqgIDuHl7jkm5ubx0AVAAAGeTBCylpe6gAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"local\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=295 295w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=590 590w,\nhttps://images.ctfassets.net/tushy4jlcik7/45idFgE5WjfADlRxw6HqW2/f7b3eaaf9173a8e53d8496fa6797c0a6/local.png?w=1180 1180w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>LocalExecutor는 Scheduler에서 각 task가 subprocess 형태로 돌아가는 구조입니다. Scale-Out이 어렵기 때문에 간단한 테스트 용도로 사용하는 경우가 많습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-pv\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-pv\" aria-label=\"celeryexecutor  dag pv permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG PV</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 68.25396825396825%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAACIlBMVEX////Wn5js19TNfHLpwr37+/vXoJm4U0bZgXfv7+/ZyMbr6uqUsvGDpu/j6/vz8/Px9Ph7oO6pwfS1yfT6+vv6+/vw8/qQrey/0PT5+vv8/P3B0/egu/P7/P+4y/RaiepfjOr+/v77+/z+/v/h6vv39/fn5+f4+Pjx9f19ou6nwPT4+v65zfbw9P3x8fHm5ub7/PzH1/iFp+98oe75+vr29veowPSat/L8/f3l7Pxzmu1+oevp6+7f4OPx8vTF1fhul+yet+zf4eP29vjC1ejc6fT09fa7y+15n+2rwOzv8POiuux4nuzF0u2htskoaatFh8bv9PmKqeqbuPJ3nerv8fPu7/JxmeuTsvGYs+v09Pb6+vr3+PiXrL9Eh8bW2+SetOLN1ebEzuOjueXe4uj7/P3B1Ofb6PTX2dzT1NfW2NrY2t3T1djc3uH19fXk5OTh4eH39/j5+frn7fyCpe+txPXN2/mNrfCxx/WMrO/x8/WivPN1nO18oOzs7vD4+Pm4y/LO2e7e4+6pv+zh5u7k6O6qwOzZ4O7o6u6xxez2+f64yvDZ4e7Y3+7l6O6HqOuRr+ueuOx6oO57n+u4ye1mket5nuurwvSbteuuw+2wxOzD0e6UsOvU3e5zmux9oevt7/GRruthjerBz+3Jy87O0NPKzM/P0dPJys3Iyczb3eDMztDc3uDIyszn6ez19vjw8vT3+Pne3t7j4+Pg4ODf398vyU9hAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAadJREFUOMtjYCAPMBKpjomZhZWVGIVs7BwMRCnk5OLGo5CHlw+Zy49LnYCgkLCIiKgIFIiJS4ggA0kpmEIRaRlZIMUKBXLyCjCmIkhaUQmmUFRZWgVIqaqpg7kamloM2jq6QJaePlihAdxEQyNjSRMTUxMggAqamRuZQEUsECaKWFpZ29jY2AKxjR1EyN7BEchxAok4AxVauLiCFTK4AQXcPTwRChm8gGxvH1+oQj//gEC4wqDgECAZCvVGGJAdHhEJJKOiY6Jj/eMQCuMTEtFMTEpOgZqYmpaOsDojMwtNYXZOLlRhXn4BRKFSIQyIQBUWgThuIMIAyde4ogwS6UgKi0tK0ZSUlVfAIx1JYZlxZRgSqGJgqK6pBTLqQLx6ZKsbGm2amlta29o7OhttbMIYGLq6e2xsej37oJ6BKwT6ul9wwsRJk6fUTAUrBPt62vQZWBTOnDprtsOcufPm29gsgAb4wkWLsSjMWLJ02fIVK1etRpi4Zu06VIWiDOvrkMEGoJgdnLcRKZkBcfSmzVu2binIL9iEEZoIEzeCs4GoCA6AyApEAgAzoY1sEHNz+AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/5p5hiUjVWUHOBKRYwHovZV/4d4786a674ddec022cb25333b9e715b1/celery3.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>CeleryExecutor는 Scheduler가 task queue에 작업을 전달하고 worker에서 작업이 수행되는 구조입니다. 지난 번 글에서 언급했듯이 여러 노드에 걸쳐 있는 DAG 파일을 동기화하기 위해 <strong>PV, git-sync</strong> 2가지 옵션을 지원합니다. 이 옵션은 KubernetesExecutor에서도 지원합니다.</p>\n<br>\n<p>위의 그림에서는 AWS EFS를 기준으로 표현했지만 다른 스토리지에서도 활용 가능합니다. 이 방식은 스토리지를 별도로 두기 때문에 git과 다르게 배포 주기를 가져갈 수 있습니다.\n그리고 worker pod이 <strong>statefulset</strong> 형태로 변경되었습니다. 이를 통해 각 worker에 PV를 연결하고 airflow UI에서 각 task의 로그를 볼 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor--dag-git-sync\" style=\"position:relative;\"><a href=\"#celeryexecutor--dag-git-sync\" aria-label=\"celeryexecutor  dag git sync permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + DAG git-sync</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.06349206349206%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAClFBMVEX///+62vTB3vXV6fgsj95EnOLt9Pn9/f3+/v+ayu+x1vP7+/uNrfB+o+/g6fvi4uLk5OTo6Oj09PTx8/h6oO6owPS1yvT6+vv6+/v5+vv09fX8/P3E1feivPP8/f/l7PzF0/D+/v77+/x1nO6GqPDS3vfw9P2vxvX29vbm5ubz8/P9/v9tluxaierl7fza5fqhvPPF1vi/0fdzm+1sluzy8/Xs7u/29/j+//+fuvOCpe97oOz6+/6btvCzxu3p6+7b4u7d4+7U3e7k6O7x8vTo7/yUse7H1O7T3O7l6O7Q2u729vjj6vB9pc2jxOP9/v709fbf5e5vl+zj5+7D0e11nO10m+vv8PO+ze1/o+96n+ydt+yJqeuasMQoaatChcXq8fja4e5ij+tlkOvC0O1lketqlOrv8fL39/fu7/K9ze1qlOxuluqctutxme2Fpuv09Pb6+vr3+Pj5+fmwwM4tbK1YlMz0+Pva3N+3vsu8w9He3+Lk5um3wNLJz9jZ2922v9HAxM22wNXV2d7m6Ovo6ero6ezn6ezp6u37/Pz19fX4+Pj4+fn09/75+/7t8v3u8/3d5/uZtvLx8fFymu1vmO28z/eDpu+cuPLy8vLV4fqJqe7o6+9mkepmkeza5PqowfR2ne6Ao+vY4fXe4+7P2e2Mq+uNrOvH1O2UsOu3ye3Fy9i5wtX8/Pz9/f/I1vHi5u7G0+2HqOyPrvGbtuyRsPF2nOuzxuyJqvDq7O65zfaWsuu7y+1qk+q/zu3O2O5vl+umvezc4+53neuQruukvOxslerN2O7X2dvJy83O0NLKzM7O0NPIyszHycvb3eDLzdDIyczu8PLz9PX4+Pnd3d3j4+Pf39/e3t7h4eHg4OD3+Pl1mjDaAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAflJREFUOMtjYCAPMDIRp46ZhZWNHbc0B4LJycXAjVMdDy8fjMnOL8AgKCiEXZ2wiKiYuLiEOARIiksBsTgYQwSkYQrFZWTlkPTJK6Cao6gEY0lCbeWGAGUVVSiLHU2huJqsOpDSAGJNLQZtHV09Bn0DQ6gIikIjYxNTU1MzIDY1Z2CwkGBgsLSyholIIim0sbWzd3C0t3dytncB8oHB4+rmbu/haW/vZW/vDVTo4+vnD1LIEGAfGBQUHBIaBlPIEG4fERllH60SA1YYGxefAPZMgH1iUrJjSmqafTrQDxlAnGmflZ1jn5uXb19QWFRcUlpWDjWxorKquqa2DsnE+oZG+4qmZrCJhS2tDFCFINDW3oGkEARa2kFu7GTg7hKCKPSXBgOJ7u5iUPiBAhXE7wERikCFMF8z9FqAGZDU0NcPJCYg+EgKJxpPAjMmg8kpU/kYpk2fAWTNRFc4a+pseziYM3fefIYFCxfB+ObIVi9eYr90mVPi8hXBK1fZr16zlmHd+g329huXO9hDPANXCPT1ps3Ltmzdtn1Hqn3LTnA42tuH7dqNReGevfv2Hzh46PARe/tMaPAcPXYci8ITJ0+dPnP23PkLCIXnL7ajKzS/hAxMgWKX4bwrSKkHiAuvXrt+4/rNa7euYuQUhMLb4PyCyDPiuPIMkQAA9+OvohIt3QoAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=630 630w,\nhttps://images.ctfassets.net/tushy4jlcik7/3ZgJBdBXHTXvfqzRkRlroV/029606fb3f630f35939c4be45de6ab8f/celery4.png?w=1260 1260w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>git-sync 옵션을 사용한다면 위와 같은 그림으로 구성됩니다.\nairflow의 각 컴포넌트에 git-sync 컨테이너가 sidecar 형태로 추가됩니다.\n이 방식은 <strong>DAG 전용 git repository가 있다면 자동으로 배포를 구성할 수 있다</strong>는 장점이 있습니다. 처음 차트를 배포할때 init container 단계에서 git clone을 수행하고 이후부터는 git-sync 사이드카 컨테이너를 통해 주기적으로 pull을 수행하게 됩니다.</p>\n<br>\n<h2 id=\"celeryexecutor--keda-autoscaler\" style=\"position:relative;\"><a href=\"#celeryexecutor--keda-autoscaler\" aria-label=\"celeryexecutor  keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor + KEDA AutoScaler</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 583px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 85.76329331046313%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAiCAYAAAAtZZsLAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAABsZJREFUWMPFmFtoFGcUxzetWCmWalfaatREbaxSW2xoBaWKFFoQIX2oIlgEaZ/iQ3zpo5aWivZFJBY0PsRACkpiBI3GVG0umk2iuWfvm93Z3dnbZK8zO3u/ZE/PN3sxm+xlkmpd+DO7M7Pz/b7znct3RiL5b5/1qC2ojajNqG2oD1FVmeNHqLckr/GzBlWD2oralPlOQCszsB+j3nwtZDt27Kg4c+bsJwMDslMqlbrJYKAeUJRxkDKaZDN6Q6dcoWzs6e09WV9/qgrv/f/Ajhw5+q5MNvizyUxrY/EEJOdSJRUKR1IGyvjs74cPT+7cuXPlS4FwOp0Sk8m0zWg0fmM2mzcAgKR6y5Y3Hj56fMrpcnvKQRWT1WYzdHTc/m737t3Lh6NpeoXBYGjW6/UpFKDiarX6D41W11NoULfHCw5mFuwOBmadLuF79refDyy6n1h9fHziel1d3dvLAqQoqmFsbAw6Ozuhra0N2tvbQavVQiAQXDQYbbGAyWxOQyEQk4FLAzpgeloO4UikoDVx2Yfr6+vfWwobib7VaL3HQ0ND0NLSAo2NjXDlyhVAC4LFzoCLj+ZJQTPCYDa7A8bGx0GuUIBcroCR0VGIJ5LABwIQCoWLLrnRZB45duzYarGAH6BWImCnTCaD5uZmuHjxIly+fBlUKhW4XO5FAzAuj3AMIgSBIoAKhRItrhPOlwMkmpqWd9TU1FQsZYnrFApFikD29/dDX18f8UNcqmhB/8v6HkarYDXiYzy6A1lmsvzRaKwkYCI5B10PHvwkGhAjVzI1NfUbHgUwjGJhQF84AdOzAVC6gqByBsEfeZFi4gjl8fpAbbYDM+sEzs8LA4uNblwd9/HjP6wVDalSazqys8s+xBmMQ7+Zg26DF+QIOurgwR2K5w3k4GOLLYz+abHawIsTKAU5PPzsF1FwDadPb0SLJRY+gEOLDVv98A/lAzla8ImZhSH8LbNwYPWnl59ZADgxOQXPR0agD12F+GcpQAw0u1S6bkVZwAHZ4OlySxKMJYWj3RsD2hXNacISBGo2kndOrKyeKFxvafm6LOCMXn9frO/Qzigst6oslJlMcHLyQkm47dtrKmiLlcFSJ6QV4jdutzsnn8+XF80E0MvHwR9M5MnNxRadK3XNh88w47P0BupRScCqqqrVPpZL8TyPgC7AnAhKpVKQ1WqFWCwGgXl5jQByOIDDMQta3QxGPC1MwO5OT4LkwCj+h5yLxtIBlbuGaYmcJ4FIIAkgTVsMJQG/3LNnk5DHEJB8CCSB83q9wm8CqJ7lwIZVxI4BobKFBECSCzHySfkSknYWgqQcEsFEpNrMB2QYJ7GYcH8W0Ga3ew8ePFgccP/+A5vjiTSgC5d5cnJSqCJyuRwfyAiAZObzLehmY8DjAFwgLhyJbAiR/b5Q9gLXyDPSgA720KHDxQGx5KwhSZkk2qx4uy7v96sMEvR/WipdXxxQKpVWkFnk/dlnKR7F+FBzGZmcEUw94YLX9I4gzNgDmfuiQBmNA2XTjIGinogFFKNwNI7LX3jL5WP9WG1eVBhsE/4sCzg6OvbrqwT0sjxMyHF/GYwILuP1sblrd+92fl8W8Pz5C5+S1JAbhENAlkJQPcx5cRvFGjKiYM6jSV/LyMPQ4HCx4PT6UTwwbk5QIPTCV30cbjg0FKi1FOj0phwg1u3A3n37yu8NKysrsZoYZAUtwjsR2ApJjz59DDD5mwNfAFg+hJEZESB9/pCgcCRe0LqkJcgC4u77qujdzI0bNw+J6dgWilhP7L0kQTtdXsyVbrLU0d/PndsqGnDXrl0SpUp9T+xgZDK40QW1Rgs6nQ4sFiuUmiCpIGSfmWnKSM/jxv3nZ0tqns6cPbsBO0yXGEBSxsiA5JNMJiGVSgHL+YvnPJoWwIaHh6G7u1v4jmVVW11dvTbzuiSrMkt98+YB9JOIWEBSErFtBZZliwJGsAXIWq6rqwuuXbsGGo1G+I3txec47FeoWpS45rmtrf0w+ki4nD8ZjSahRGa1sOrMnwyBmZmZgUuXLkFPT08O2GQyET8kS/1t5gWUuE9r6197sfDbigGSfoREoxObJ87vR+txmIS5ohPC5YwSoKdPn+bg8FwvLrck8xKKtMDSJflkQ0ODFFvEVnTwuUWvNHC3QnY0FO5m0s08LXR6BdJKFHuP83fu3NmAQLdQ8Yxuo/XWvZT3Nlebmr5QazS3/DwfFxvlJAljnms6Ny+VTE9PSywWyyr02VUej+flvuGqra2VnDhx4v2e3t4fMbW0osWmrDa7D62YxC4ugRZ1GU3m50qlqune/ftHcY/3znLH+hdYFfgwh/kodgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADkwWYzemwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANTgzEOszAwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTAw3DQJxwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=146 146w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=292 292w,\nhttps://images.ctfassets.net/tushy4jlcik7/w8juWviWwsFWzYn3oA0hQ/5f47b74cd9e3b94ebcfb10aa7254d0d9/keda1.png?w=583 583w\"\n        sizes=\"(max-width: 583px) 100vw, 583px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p><strong>KEDA AutoScaler</strong>는 공식 차트에만 추가된 옵션입니다.\n기존의 Horizontal Pod Autoscaler는 리소스(CPU, Memory) 메트릭을 기반으로 스케일 여부를 결정하게 됩니다. 반면에 KEDA는 <strong>특정 이벤트를 기반으로 스케일 여부를 결정</strong>할 수 있습니다. 예를 들어 airflow는 metadb를 통해 현재 실행 중이거나 대기 중인 task가 얼마나 존재하는지 알 수 있습니다. 이러한 이벤트를 활용하여 worker의 scale을 결정한다면 queue에 task가 많이 추가되는 시점에 더 빠르게 확장할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> <span class=\"token number\">16</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>이를 위해 airflow에서는 KEDA의 <strong>PostgreSQL trigger</strong>를 활용하였고 실제 위와 같은 쿼리가 등록되어 있습니다. KEDA는 CRD와 custom controller로 구성되어 있기 때문에 기존 HPA와 함께 사용 가능하며 모든 K8S 클러스터에 추가할 수 있습니다.</p>\n<br>\n<h2 id=\"celeryexecutor-vs-kubernetesexecutor\" style=\"position:relative;\"><a href=\"#celeryexecutor-vs-kubernetesexecutor\" aria-label=\"celeryexecutor vs kubernetesexecutor permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CeleryExecutor vs KubernetesExecutor</h2>\n<p>여기까지 CeleryExecutor에 대해 알아보았습니다. CeleryExecutor 또한 Kubernetes 위에 배포하면 Helm 차트를 통한 선언형 리소스 관리, 쉬운 버전 업데이트, DAG 배포 자동화, 쉬운 리소스 확장 등의 장점을 가질 수 있습니다. 하지만 Celery에 대한 의존성이 남아있기 때문에 Redis, Celery Worker에 대한 리소스를 계속 점유하고 있어야 합니다. 다시 말해서, <strong>Scale to Zero</strong>가 어렵다는 단점이 있습니다. KubernetesExecutor는 task가 존재할때만 pod이 생성되고 task가 완료되면 종료되기 때문에 더 리소스를 효율적으로 사용한다고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-kubernetespodoperator\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-kubernetespodoperator\" aria-label=\"kubernetesexecutor kubernetespodoperator permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor, KubernetesPodOperator</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 407px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.35135135135135%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAABRFBMVEX////R3vns8f3f6Pve5/vM2vhlkesybOU7cuaQr/Ht8v18oe41buVUhOmWs/LH1/hymu21yvZPgenu8/03cOZ7oe5zmu02b+br8fyVs/I6cuaat/KCpe96oO6Dpu/p8PzC0/dgjeutxPW/0fedufOEp++90Pdpk+yhvPOIqfBSg+mivPPh6vv+/v9VhemRsPFZiOo/deesw/ScuPKlv/SFqO9QgumCpu/09/7j6/t/o+83b+Y+dOZijuv6/P7s8v1Ie+g8c+aKq/B7oO5Geufq8PxYh+pEeefo7/zO3PlmketslezL2fj+///m7fzb5vra5fry8vLv7+/u7u7k5OTn5+f8/Pz19fXt7e3r6+v4+Pjl5eXOzs6+vr6pqamampqoqKjT09Ozs7Ojo6OkpKT7+/v9/f2ysrKgoKCfn5+xsbH39/fRl5OdAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUDTMjigxdJgAAAM5JREFUKM9jYBimgJEJlc/MgiwJZ7EygsA3hDIOEPcPjAvXxP+DgYEDSaEw42cGPkZOxhfoCrm4QQa+lH8I5fMy8gH5j+RhCuHO4nvHy/uOgYEdxv/Jyc7BwaHOyYCukFPzJqeGGAMPjC/Dw/eTh4eBG0PhRS62a5yXzeAKubgey3JxiWEq/P+TQZ7LgfsQjH+Qk52Tk4NjN2Yo+jKysvohC/izsgZghmMgIwwsg4pEM/xg/c+4Aj0cueEKoQJpjMDwYfiZOpu4WM0eUmkQAMmNIn40kIGaAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubeexec2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=102 102w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=204 204w,\nhttps://images.ctfassets.net/tushy4jlcik7/7aImqhPOqW08NxOj0rGEjK/aa9cf6a2be5efeea4fcf8496d9c4526b/kubeexec2.png?w=407 407w\"\n        sizes=\"(max-width: 407px) 100vw, 407px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>위의 그림처럼 KubernetesExecutor는 Broker와 같은 리소스를 점유하고 있을 필요가 없습니다. 리소스를 할당하고 스케줄링 하는 역할은 Kubernetes Scheduler가 수행하게 됩니다. Airflow Scheduler는 API Server에게 task 수행을 위한 Pod 생성을 요청합니다. worker는 <code class=\"language-text\">images.airflow</code>에 설정한 이미지로 Pod이 생성되기 때문에 추가로 필요한 파이썬 패키지가 존재한다면 별도의 이미지를 만들어주어야 합니다. 만일 task pod 마다 다른 이미지와 리소스 설정을 가지도록 하고 싶다면 <strong>KubernetesPodOperator</strong>를 사용하시면 됩니다. KubernetesPodOperator는 worker를 통해 pod이 생성되는 구조이므로 파라메터를 통해 사용자가 원하는 설정으로 변경할 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-process\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-process\" aria-label=\"kubernetesexecutor process permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Process</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 19.869174161896975%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAICAMAAAC8jE1pAAABMlBMVEXs3sjl3Lro37zj27nj1sD////z6Nrk27nl3brl2MTr3sbm3rvm2Lj08/T78vHg077z7Ovs5OPm3Nvh2djl3t719fX09PTx8fH29vb5+fn38/Pr4eDu6Ojy6+rs4+L7+/v+/Pzt5+b79vfy7O718PL17/Hz7u/18PH07vD28PL38vT89/j57fH18fLy8vLt7e3w8PDv7+/z8/P4+Pj++/z48fP38fP48/T48vT58/X57vHx7e749fbu7u7r6+vq6urs7Oz48PP68PP9+vv46e789vj79ff9+fv68er68ub14tn36d/05uH57Or36t/57uP37+n68en67+T57uT8/Pz9+fn68eX37+jm2sra0bjc1LrY0Lfb0MDw5t3Z0Lfd0sTl2cja0rncz7j08/P79fTYzL1fQRlSAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAMVJREFUGBldwbFOg1AAhtH/g3uxvcaAqGk6mFQHV4wP4NzBwVd1cPUdcHRxs2nSoVhNMYWL0EBjPAfRUY9WpYHdOiil8YYTk9ARErA63zqWGpx9uZAPKQ1dhNUlndpQWUSrWUpT4FXKcu1luZHSXH/cwmaGPHCjmFRTHywmktE/R1CWyac/9cVF8R1deYmZQ1jd75pgHTcBdeiLxEKjg+BFe1nOnNa7etfAswYP5RiepEcqaxJab+rdsYt0EI9GICmuf45/AcsMMsor7EW1AAAAKXRFWHRjb3B5bGVmdABHZW5lcmF0ZWQgYnkgaHR0cDovL3BsYW50dW1sLmNvbREwORwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-happy-path\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=306 306w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=612 612w,\nhttps://images.ctfassets.net/tushy4jlcik7/2usGvGAxaTlKGcNVJZcawO/37094fe04db84de87652672da1f50543/k8s-happy-path.png?w=1223 1223w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>KubernetesExecutor는 위와 같은 프로세스를 통해 동작합니다. 일반적으로 Pod이 생성되는 과정과 동일하며 airflow에서는 내부적으로 python kubernetes client library를 통해 k8s_model 이라는 객체로 K8S API를 추상화하여 사용하고 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 25.021949078138718%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAKCAMAAADxROxiAAABTVBMVEXs3snh2Lfn3rzj2rno3rzv6On////w49Lk27ng0rv78vTn37zh2bfk1Lf29vb37OPg17bm3bvf0b7y6ujr4t7q39vp4Nvq4d349vb9/f3+/v78/Pz07uzp4d7+/Pzs49/r4d3q4Nz7+/v59PPr5OH9+Pnm4OLq5Obp4+Xr5efs5ujn4ePz7e/89vj46+/79/n//v7++/z9+vvx6ezt5+nn4uP28PL46e79+/zm0tjl3eDr6+vs7Ozt7e3u7u7o6Ojy5enm4eLk3uDo4uTh293l3+H9+fr79ffr4+bj3d/m5OXp6enq6ur47+b47+H26dz259v27e/26OP25dny4tv68PP05dn05Nj049n58/X47Ory4NXz6uLl2crUy7Pa0bnVzLTZ0Lfu6Onr4NTSyrLUyLf89fbZ0LjY0LfUzLTXyLT19fX17OXUy7TWyr2LLkr2AAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMjigxdJgAAAPFJREFUGBltwd1KwmAAx+H/793ctFoFexeZgoQG4cdp0FF0Ad1z95ASgwgPXBR+UFSgK2c4B3rQ8yBy2iD1WargZg4wlyqAG7I2C5lEGlszp/ymggXESLIfHOGpAUisDJkDPNZHdjVVaMZ20magXLfvSkFfO3oXy/OVU+ObwyD00yib2oms5EqedpUetNWuNGjSWroLudJCu8rNU9BLLakn1SQ9uVeuIzzdMgzs8MxkiTLjmFhb7dmrcp2BkZ5NtPcZLryfVlQN3/f1j24k7gDxpI2LzCFW4ZLUh77U4ytwj1mLtXHFbylW4Zq1WLrhwP8DAqlB7pNn/wEAAAApdEVYdGNvcHlsZWZ0AEdlbmVyYXRlZCBieSBodHRwOi8vcGxhbnR1bWwuY29tETA5HAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-failed-pod\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=285 285w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=570 570w,\nhttps://images.ctfassets.net/tushy4jlcik7/5DNugNWbyej6H0ls4cPuix/426601ff509e37357de86d7521439406/k8s-failed-pod.png?w=1139 1139w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>task가 완료되기 전에 Airflow DB 상태 업데이트 단계에서 OOM 등의 이유로 Pod Crash가 언제나 발생할 수 있기 때문에 이에 대한 장애 시나리오도 준비되어 있습니다. DB 업데이트에 실패하더라도 airflow scheduler는 Kubernetes Watch API를 통해 pod의 상태를 전달받아 다시 DB 상태를 업데이트 할 수 있습니다. CeleryExecutor의 경우, task 상태에 대한 처리를 celery에 주기적으로 확인하는 방식이라면 <strong>KubernetesExecutor는 이벤트 스트림으로 전달받기 때문에 스케줄러에 대한 부하가 더 낮다</strong>고 볼 수 있습니다.</p>\n<br>\n<h2 id=\"kubernetesexecutor-batch-cronjob\" style=\"position:relative;\"><a href=\"#kubernetesexecutor-batch-cronjob\" aria-label=\"kubernetesexecutor batch cronjob permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubernetesExecutor Batch, CronJob</h2>\n<p>공식 차트에서는 사용자의 편의를 위해 RBAC 초기 사용자를 생성해주는 <strong>create-user BatchJob</strong>이 추가되었습니다. <strong>Helm Hooks (post-install)</strong> 를 통해 차트 리소스가 모두 생성된 이후에 수행됩니다. 더 이상 exec 명령어로 bash에 들어가 create-user 명령어를 수행할 필요가 없습니다!</p>\n<p>추가로 <strong>cleanup CronJob</strong>이 있습니다. <code class=\"language-text\">AIRFLOW__KUBERNETES__DELETE_WORKER_PODS</code> 옵션을 통해 task가 끝나더라도 pod이 종료되지 않도록 설정할 수 있는데 이때 내가 원하는 주기마다 오래된 pod을 삭제할 수 있는 CronJob 입니다.</p>\n<br>\n<h2 id=\"official-helm-chart-issue\" style=\"position:relative;\"><a href=\"#official-helm-chart-issue\" aria-label=\"official helm chart issue permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Official Helm Chart Issue</h2>\n<p>공식 버전 차트는 아래와 같은 이슈가 남아있지만 2.0 정식 버전 출시와 함께 해결될 예정입니다.\n글을 작성하는 과정에서 DAG 동기화 관련 버그를 발견하였지만 리뷰를 통해 곧바로 수정되었습니다. (<a href=\"https://github.com/apache/airflow/pull/9371\">PR-9371</a>). stable/airflow 차트와 비교했을때 아쉬운 점은 아래와 같습니다.</p>\n<ul>\n<li>현재 버전에서는 backend로 postgresql만 지원 <a href=\"https://github.com/apache/airflow/issues/9627\">(ISSUE-9627)</a></li>\n<li>pip 등 작업 실행에 필요한 패키지 설치하는 옵션이 없음</li>\n<li>initContainer를 수정해서 설치하거나 이미지 별도로 생성해야함</li>\n<li>차트에 Ingress 설정에 대한 옵션이 부족</li>\n<li>KubernetesExecutor의 경우 remote logging 설정을 해야 UI에서 로그 확인 가능</li>\n</ul>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>사실 배포와 옵션에 대한 내용은 지난 글에서 말한 내용과 크게 다름이 없습니다. 아직 정식 릴리즈까지 변경될 여지가 많다보니 아래 공식 문서 따라하시는 방법을 추천드립니다 <a href=\"https://github.com/apache/airflow/tree/master/chart\">(apache/airflow/chart)</a>. 다음 글에서는 KubernetesExecutor의 로깅과 모니터링에 대해 다루어보겠습니다!</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"6458380e-9bc8-5184-a818-51a7dd2dbaa6","title":"Airflow on Kubernetes (1)","slug":"airflow-on-kubernetes-1","publishDate":"June 05, 2020","publishDateISO":"2020-06-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-on-kubernetes\" style=\"position:relative;\"><a href=\"#airflow-on-kubernetes\" aria-label=\"airflow on kubernetes permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow on Kubernetes</h2>\n<p>Airflow를 Kubernetes 인프라 위에서 운영하는 방법은 크게 두 가지로 나눌 수 있습니다.\n이 글에서 소개할 방법은 <strong>CeleryExecutor의 각 모듈을 Kubernetes 위에 올리는 방식</strong>입니다. 기존에 운영하던 형태와 유사하기 때문에 쉽게 적용할 수 있으나 Celery에 대한 의존성이 강하다보니 완전히 Cloud Native한 형태는 아닙니다. 아키텍쳐는 가장 많이 사용하는 <a href=\"https://github.com/helm/charts/blob/master/stable/airflow\">stable/airflow</a> Helm Chart를 참고하였습니다. 이제 몇 가지 컴포넌트 설정과 함께 자세히 알아보겠습니다.</p>\n<br>\n<h2 id=\"config\" style=\"position:relative;\"><a href=\"#config\" aria-label=\"config permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Config</h2>\n<p>Airflow는 <code class=\"language-text\">airflow.cfg</code> 파일 또는 <code class=\"language-text\">AIRFLOW__[SECTOR]__[VARIABLES]</code> 환경 변수를 통해 각 컴포넌트의 설정을 관리할 수 있었습니다. Helm Chart에서는 <code class=\"language-text\">values.yaml</code>의 config 필드를 통해 설정을 관리할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token comment\"># CORE</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DEFAULT_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__PARALLELISM</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"32\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__DAG_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n  <span class=\"token key atrule\">AIRFLOW__CORE__MAX_ACTIVE_RUNS_PER_DAG</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># WEBSERVER</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__DEFAULT_UI_TIMEZONE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Asia/Seoul\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__WORKER_REFRESH_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"60\"</span>\n\n  <span class=\"token comment\"># CELERY</span>\n  <span class=\"token key atrule\">AIRFLOW__CELERY__WORKER_CONCURRENCY</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"16\"</span>\n\n  <span class=\"token comment\"># SCHEDULER</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEARTBEAT_SEC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__SCHEDULER_HEALTH_CHECK_THRESHOLD</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"120\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__DAG_DIR_LIST_INTERVAL</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"30\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__RUN_DURATION</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10800\"</span>\n  <span class=\"token key atrule\">AIRFLOW__SCHEDULER__MAX_THREADS</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2\"</span></code></pre></div>\n<br>\n<p>위에 정의한 설정 변수들은 Airflow의 성능과 관련되어 있기 때문에 각자 할당된 리소스에 맞게 설정해주셔야 합니다. 자세한 내용은 <a href=\"https://airflow.apache.org/docs/stable/faq.html#how-can-my-airflow-dag-run-faster\">공식문서 링크</a>를 참고하시기 바랍니다. 위와 같은 방식으로 DAG에서 활용하는 connection, variables도 정의할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># config.yaml</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ConfigMap\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">data</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">webserver_config.py</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">|</span><span class=\"token scalar string\">\n    APP_THEME = \"flatly.css\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># values.yaml</span>\n<span class=\"token key atrule\">extraConfigmapMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/webserver_config.py\n    <span class=\"token key atrule\">configMap</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>webserver<span class=\"token punctuation\">-</span>config\n    <span class=\"token key atrule\">readOnly</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">subPath</span><span class=\"token punctuation\">:</span> webserver_config.py</code></pre></div>\n<br>\n<p>위와 같이 <code class=\"language-text\">ConfigMap</code>이나 <code class=\"language-text\">Secret</code>을 따로 만들고 참조하도록 연결하는 방식도 가능합니다. 특히 Airflow 1.10의 RBAC을 사용한다면 <code class=\"language-text\">webserver_config.py</code>를 통해 <code class=\"language-text\">APP_THEME</code>를 변경해줄 수 있는데 이런 경우에 <strong>extraConfigmap</strong>을 통해 적용할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.861111111111114%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUDTMlY2/4EwAABPJJREFUGBm9wV2OHGcVBuD3PedUVXfPTDu2x7GTSE4CXCCxBO5hA6yPHbAAYDGRECgOGTvz457uqu8752VcYiRLjhSueB7+6q9//uJoerG77UvQjtnPYwBwnz1oW4/3vTm583i7nC5iBPQ+++W4ed/bTV/wcy7HjYFdFbTBTIKgfy/HV+NuUZZw3ef4/eU3svcbP0tJEAADARREgGBBDhZQUpAFlOSkgJTwc4IUQED4LwK/lSbzgkrqEm9u76q03UzTNOL/KFrrd4fDvGw+v3yGj9zc3QkwsiQ335+f4X8gQRJ+CYnYX5yNg5OUhEdV9Ze//T3ctbo4P//TH/+AX/Lj1btxGp9cnOOXVInLsnz/w48vnj/9/oerL15e4tH96QTgeDxd375/9tl+f3H+49W7F8+fudvVu+vMmpfl1Yvn4zjg0f3xdPv+0Ht++eoFgMP96eb2bl6Wb19/hdXV25+efrZ39yGC18fDP777Z1W+fP2lkwSMtjW/7st3x9vfxNnhcP/q8jnNjARQVVeHt8+2T/GJJt1XMzClvjT2+Wy328SG5L/mQ1cRLGkrfBVT0NyMrddmHLFy2mA+UNf3HWRWDcPAFYCSdptdAOxdmw0+UhC63AwqguPg0zgN9yfu9xfYdMmAU+UguEUYOW2mYYj9MOGRgGfjJmg0AjIzACQlGTl4WEFVZiYAAokHVIHoKgEinO7m6J2rpbqBCYU5iJizX129y9Kvv35tZrXC6s18mLk7HI+ZCcDdAWTm9f31ePY5tltk4iNL5X1bglZQOy0tF9jFdr9X1u0yH7IFba4UeGlTmNu8tN67mQGwFVb2wG2IISIAkARAs2RGBD4xFEMRtIIUpZpBxA9v7PXX1t0pA41w0GhRWbmqKjPrvUvCqrJ675nZWiMZEQAyc57n1ho+0Sp7b6J1VbbmfbUsbK231rOL1isbWOZhZu5eJTMDEBF4ZGbhYW7DMOCRu8cKJB5IeEACiGJgCHIk5wQUMUTEwGGINgThtF4ImNGjqnbbTY71gCSAzMTqxbAhPvjp5mZ/fm5mAKpqtLEOBx1/4pPPZFsAJAHkCmRKvfdJhkJGsPf8oEBVVUJlFZMHSUgkAZA0c0AAEgr3IaIkriTRTJCZKTsJmeHRGLEnSEBYin1pfCCZ2ejODzApdgItQtB2Oy1GkABKAoRV0ASR3IwjViRVBUIQYyMO+EhJXRWwkmDcTWeDDQQkbMwHGslTdhAgA8Jut9tuN5BIAigJKwMBTMOwmSatAEiqKtFqPCMHSAKIDySV1JQCVCI+6L27SsKpuoFdtaELig5lZbaOFUlzx+rNcv+7ODvOs7lDIgnA3YcYbLPhNMFMEgCSeJBaVE4D0CvV52GKGEd3Py55Xxm0udJRRkZVnea5tyYJgKTMxKqqWu9La701kOEOIDNPyynzVvOMp0/xkV7Zs4MGoPe+9+2AQfOp9d5669lFWyobmObh7u/e3vTW3R0rd8fK3YeIqhrHEY/MzMNj/wSf6LKR5WRKHnXX7ly8+OZbcx/6OBidzOIAc3hkZn+QWVUgCWRmVQHIzNZ7Zi7LQtLdAWRWW+ETTdlaKzKl3pu33h6wWWZ7UL3AXtnBMgsz21+cZyZJAJJsBeDl5mwchnEcIwIASQAefjadRQRICIDwAQF40as7DSq4T+NmGqaIMDN/ADlphIOk/Qe+jUKpgXz4fQAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjg4MBPhhNoAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE1ODCwd2OPAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAfHRFWHRleGlmOlVzZXJDb21tZW50ADg1LCA3OCwgNzMsIDY3LCA3OSwgNjgsIDY5LCAwLCA4MywgMCwgOTksIDAsIDExNCwgMCwgMTAxLCAwLCAxMDEsIDAsIDExMCwgMCwgMTE1LCAwLCAxMDQsIDAsIDExMSwgMCwgMTE2LCAwqi0O4wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=720 720w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=1440 1440w,\nhttps://images.ctfassets.net/tushy4jlcik7/7LvzyngOcQO4D6jIwRlQUb/52a76f0b579ccdb4dea892df1b236156/airflow.png?w=2880 2880w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>제가 주로 사용하는 테마는 <code class=\"language-text\">flatly.css</code>에 <code class=\"language-text\">NAVBAR #18bc9c</code> 컬러 조합입니다. 적용된 화면은 위와 같습니다. (+ 태그 기능도 1.10.10 버전에 추가되었습니다)</p>\n<br>\n<h2 id=\"celery-worker\" style=\"position:relative;\"><a href=\"#celery-worker\" aria-label=\"celery worker permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Celery Worker</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 39.050000000000004%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACN1BMVEX19fX29vb////8/f7w9Prt8vru8/ry9fr+/PT9+Oj9+On+/fvL2/LX5vra6PzV5PnW4vT6+vr+/v7+9uHw5MDYza3f1LPXzKzc0bD+8cv18+zx8vT6+/319/vT4vjBz+OmssSlssTU4/fW4/b5+/37+/v49/T9+e39+vD09PT99+b98tD++/PAzuK0v9C7x9i0wNC3w9TQ3e75+vz/8szHvZ/q3rv+8Mn29fXj7Pjb5/jZ5fjZ5vjd6Pjr8fr2+Pjt8O/08d/w6MNbVkmEfWn+8cn29fT7/Pr99+Xg1LO6sJXPxKXu4bzt7Orw7+vw8O7x8fHu7u7+/fr9+ev///7++/H479X379T58Nb68tn27ND58djn5+fb29vp6en99+L878rs4L306MTv47/98Mv7+fD5+/z39/fj4+Pi4uLy7uL38uH28uj77snr37zo3Lrp3brm27j+8cz39e3t7e3w8O/x8/Du8e3z9PPa2trU1NTr6+v058P++vD39/T9+u7++vHv8PDw8fPt7/Lz8/Tc3NzHx8fQ0NDf07Lb0K/6+Ovy8/HNwqTt4b7w8PD9+Of+8cr+/PX1+Pf+/vz+/v38/fvv9u3s9On6/Pn2+vTi17W2rZLOw6Xw477T49DF1sTI2sfG2MbO5MvU6NPV59L5+/f17NL17NH27dL48Nb2+vW7zbiToJKMmYujsaKbqZvJ3sbV6NTU59Px9+/3+vX4+Pjg4ODs7Ozn8eTV6NLQ5MzS5c7g7d18ZoviAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAAVxJREFUGBltwbFLVHEAwPHvNx6Y172uu6EjjRYvsvbIxVFNg7CGhtZoabBACP8FG4KoMRyqQaGCCCu6liCIXHIRunBKOqSGHmoRNdjvHe93XdDnI1IQzP3mf7RPAv0hlBTdIqhkQDUj0poRFn5Cv4K2iBLqknNtECrmvtTfD6wfLxnQlfCBqM1hc6sw1LCDroRe7yjsfTlh8IszooAJ0y8IJn3EP1KDRdOPHFPcSkgvqE+qMnWXvxo13Xkw3DpwCu8A01q7aMfi5i6FgfZY83IKLGSz5jaOrCXwltObq0y2pcdQXbCelc2dWGEPfN4oH/1EemOMHusPl9P9zytsl/eVvn1fGW3oTQnm566NNyl46PpjO14RJczemgPmZ4DbEuiVdt/rifPqEl0JXCWYIehXDO7fg5Gy2pQooevsJaNzg42TT93ZHm4RCS6/YXRqV3nmVzio40AlA6oZ0R95mVFwFhLj3QAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"celery\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=500 500w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=1000 1000w,\nhttps://images.ctfassets.net/tushy4jlcik7/2xWBy0Pj9CiXMubnr26Jgt/3b9f9baa289538f55f3cf20890aa2611/celery.png?w=2000 2000w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>CeleryExecutor에서 worker는 실제 task를 수행을 담당하는 컴포넌트입니다. K8S에서는 celery worker가 StatefulSet으로 배포됩니다. 기존에는 worker가 <code class=\"language-text\">AutoScalingGroup</code> 등을 통해 인스턴스가 자동 확장되도록 구성했다면, K8S에서는 <code class=\"language-text\">HorizontalPodAutoscaler</code>를 통해 Pod 단위로 확장 가능하도록 구성할 수 있습니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">workers</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">replicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2Gi\"</span>\n\n  <span class=\"token key atrule\">autoscaling</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">maxReplicas</span><span class=\"token punctuation\">:</span> <span class=\"token number\">16</span>\n    <span class=\"token key atrule\">metrics</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Resource\n      <span class=\"token key atrule\">resource</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> memory\n        <span class=\"token key atrule\">target</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Utilization\n          <span class=\"token key atrule\">averageUtilization</span><span class=\"token punctuation\">:</span> <span class=\"token number\">80</span></code></pre></div>\n<br>\n<h2 id=\"airflow-ingress\" style=\"position:relative;\"><a href=\"#airflow-ingress\" aria-label=\"airflow ingress permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Ingress</h2>\n<p>보통 K8S 클러스터에 Ingress Controller를 설정하고 path를 통해 여러 서비스에 접속하는 경우가 많습니다. Airflow Chart 역시 Webserver와 Flower UI에 대한 ingress를 지원합니다. 저는 nginx-ingress controller를 사용해서 진행해보겠습니다. 아래 예시는 각자의 ingress-controller 설정에 맞게 바꾸시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token punctuation\">}</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n    <span class=\"token key atrule\">externalPort</span><span class=\"token punctuation\">:</span> <span class=\"token number\">8080</span>\n    <span class=\"token key atrule\">loadBalancerIP</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n    <span class=\"token key atrule\">loadBalancerSourceRanges</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">ingress</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">kubernetes.io/ingress.class</span><span class=\"token punctuation\">:</span> nginx\n      <span class=\"token key atrule\">ingress.kubernetes.io/rewrite-target</span><span class=\"token punctuation\">:</span> /\n      <span class=\"token key atrule\">nginx.ingress.kubernetes.io/ssl-redirect</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"false\"</span>\n\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n    <span class=\"token key atrule\">host</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"myloadbalancer-domain.com\"</span></code></pre></div>\n<p>예를 들어 web path에 <code class=\"language-text\">/airflow</code> 라고 설정하셨다면, UI 접속 주소는 <code class=\"language-text\">myloadbalancer-domain.com/airflow</code>가 됩니다. flower도 위와 동일한 방식으로 설정하시면 됩니다.</p>\n<br>\n<h2 id=\"airflow-auth\" style=\"position:relative;\"><a href=\"#airflow-auth\" aria-label=\"airflow auth permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Auth</h2>\n<p>Airflow 에서는 다양한 인증 방식을 지원하지만 여기에서는 가장 기본이 되는 Password Auth 방식으로 배포하겠습니다. 새로 추가된 RBAC 설정도 함께 추가해보겠습니다. 먼저 <code class=\"language-text\">extraPipPackages</code> 설정을 통해 의존성 패키지를 설치해주고 상단에 환경 변수도 추가해줍니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">config</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__RBAC</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTHENTICATE</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"True\"</span>\n  <span class=\"token key atrule\">AIRFLOW__WEBSERVER__AUTH_BACKEND</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow.contrib.auth.backends.password_auth\"</span>\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">web</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraPipPackages</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-bcrypt\"</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token string\">\"flask-oauthlib>=0.9\"</span></code></pre></div>\n<br>\n<p>이제 로그인할 사용자를 추가해주어야 합니다. Scheduler Pod의 Bash에서 create_user 명령어를 통해 생성해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ kubectl exec \\\n  -it \\\n  --namespace airflow \\\n  --container airflow-scheduler \\\n  Deployment/airflow-scheduler \\\n  /bin/bash\n\n$ airflow create_user \\\n--username=admin \\\n--email=test@example.com \\\n--password=mypassword \\\n--role=Admin \\\n--firstname=test \\\n--lastname=park</code></pre></div>\n<br>\n<h2 id=\"airflow-iam-role\" style=\"position:relative;\"><a href=\"#airflow-iam-role\" aria-label=\"airflow iam role permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow IAM Role</h2>\n<p>AWS EKS와 같은 클라우드 서비스 위에 배포한다면 각 컴포넌트의 세부 권한을 지정해주어야 합니다. 만일 Pod에 IAM Role을 할당하지 않는다면 Airflow는 클러스터의 기본 IAM Role인 EKS worker 설정을 따르게 됩니다. 따라서 보안을 신경쓰셔야 한다면 설정하는 것이 바람직합니다. 특히 Airflow에서 다른 AWS Managed Service(EMR, Athena, Lambda)와 연계하는 DAG이 존재하신다면 필수적입니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">serviceAccount</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">create</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow\"</span>\n  <span class=\"token key atrule\">annotations</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">eks.amazonaws.com/role-arn</span><span class=\"token punctuation\">:</span> arn<span class=\"token punctuation\">:</span>aws<span class=\"token punctuation\">:</span>iam<span class=\"token punctuation\">:</span><span class=\"token punctuation\">:</span>123456789999<span class=\"token punctuation\">:</span>role/airflow\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">securityContext</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">fsGroup</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1000</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">values.yaml</code>에는 포함되어 있지 않지만 각 컴포넌트마다 <code class=\"language-text\">securityContext</code>를 지정해주셔야 IAM Role을 매핑할 수 있습니다. <code class=\"language-text\">IAM Role for Service Account</code>가 내부적으로 K8S TokenProjection을 사용하기 때문에 설정을 안하면 토큰을 읽을 수 없다는 오류가 발생합니다. IAM Role 설정에 대한 자세한 내용은 <a href=\"https://docs.aws.amazon.com/ko_kr/eks/latest/userguide/iam-roles-for-service-accounts-technical-overview.html\">EKS 공식 문서</a>를 참고하시기 바랍니다.</p>\n<br>\n<h2 id=\"dags\" style=\"position:relative;\"><a href=\"#dags\" aria-label=\"dags permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAGs</h2>\n<p>Airflow는 Scheduler가 DAG 파일을 주기적으로 동기화하며 문법적 오류가 없는지 체크하는 역할을 수행합니다. 단일 노드에서는 로컬에 있는 DAG 파일을 읽으면 되지만 K8S에서는 worker pod가 여러 노드에 걸쳐있기 때문에 모두 같은 DAG 파일을 바라보도록 하는 동기화 설정이 필요합니다. Helm Chart에서는 이를 지원하기 위해 두 가지 옵션을 제공합니다.</p>\n<br>\n<p><strong>1. Git-Sync Sidecar</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># git-sync sidecar</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">git</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">url</span><span class=\"token punctuation\">:</span> ssh<span class=\"token punctuation\">:</span>//git@repo.example.com/example.git\n    <span class=\"token key atrule\">repoHost</span><span class=\"token punctuation\">:</span> repo.example.com\n    <span class=\"token key atrule\">secret</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>git<span class=\"token punctuation\">-</span>keys\n    <span class=\"token key atrule\">privateKeyName</span><span class=\"token punctuation\">:</span> id_rsa\n\n    <span class=\"token key atrule\">gitSync</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n      <span class=\"token key atrule\">refreshTime</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span></code></pre></div>\n<br>\n<p>첫 번째 방식은 <strong>git-sync 사이드카 컨테이너</strong>를 활용하는 방법입니다. 간단히 말하자면 주기적으로 외부 저장소를 당겨오는 방식으로 git 인증이 필요합니다. 사이드카 패턴이 생소하시다면 이전에 작성한 <a href=\"https://swalloow.github.io/container-patterns/#sidecar-pattern\">분산 컨테이너에서의 디자인 패턴</a> 글을 참고하시기 바랍니다.</p>\n<br>\n<p><strong>2. Shared Persistent Volume</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token comment\"># EFS PV, PVC</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolume\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">capacity</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 20Gi\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">nfs</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">server</span><span class=\"token punctuation\">:</span> 0.0.0.0 &lt;<span class=\"token punctuation\">-</span> EFS endpoint\n    <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow\"</span>\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> v1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> PersistentVolumeClaim\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n  <span class=\"token key atrule\">namespace</span><span class=\"token punctuation\">:</span> airflow\n  <span class=\"token key atrule\">labels</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> airflow\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">storageClassName</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span>\n  <span class=\"token key atrule\">accessModes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> ReadWriteMany\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">storage</span><span class=\"token punctuation\">:</span> 10Gi\n  <span class=\"token key atrule\">selector</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">matchLabels</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dags\n\n<span class=\"token punctuation\">---</span>\n<span class=\"token comment\"># shared persistent volume</span>\n<span class=\"token key atrule\">dags</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">persistence</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">existingClaim</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow-dags\"</span>\n    <span class=\"token key atrule\">accessMode</span><span class=\"token punctuation\">:</span> ReadWriteMany\n    <span class=\"token key atrule\">size</span><span class=\"token punctuation\">:</span> 1Gi</code></pre></div>\n<br>\n<p>두 번째 방식은 <strong>EFS와 같은 공유 파일시스템을 활용한 방법</strong>입니다. EFS의 특정 경로에 DAG 파일을 저장하고 마운트를 통해 모든 Pod이 같은 경로를 바라보도록 설정하는 방식입니다. 저는 EFS PV와 PVC를 먼저 추가한다음 existingClaim을 통해 참조하도록 설정해주었습니다.</p>\n<br>\n<h2 id=\"deploy\" style=\"position:relative;\"><a href=\"#deploy\" aria-label=\"deploy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Deploy</h2>\n<p>필요한 설정을 완료했다면 배포는 아래 Helm 명령어를 통해 할 수 있습니다. 가능하다면 데이터베이스는 external로 사용하는 방법을 추천드립니다. DB 암호는 secret을 통해 생성하고 참조하도록 설정해주시면 됩니다.</p>\n<br>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">helm install stable/airflow \\\n--version 7.1.1 \\\n--namespace airflow \\\n--name airflow \\\n-f ./values.yaml</code></pre></div>\n<br>\n<p>배포 이후에 namespace를 보면 아래와 같은 Pod이 존재하는걸 확인할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.08196721311475%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABgFBMVEWruMOqt8KqtsGptsGptcCotb+ms76lsbyksLujsLqjr7qntL+grLedqbOaprCZpa+ZpK6bprCeqrQnKSwoIiMoJyEdKCIcHiAcHyAmKSuotL+ms72grLaWoqsnIiNUKyhbSB4aTSMVFxiksbucqLKQm6SQmqSksbyLlp4cHh8sLi8lJyg2OTklKCgkJicrLS4oKiuLlZ6jr7mYpK2Ik5sbHh+ir7mXo62HkppBREQzNTY7PT45OzweICEgIiM1NzgyNDU0Njc5PDwwMjMtLzAuMDGXo6yHkZomKCkpKywsLy8WGBkpLCwhIyQjJSYzNTUqLC0xMzQsLi4uMDA0NjYwMjIyNDQoKioqLCw2ODk3OToyNTUvMTIvMTGYo62IkpsnKSoiJCWKlZ4fISIwMzObp7GPmaMjJigaHR4aHB4aHB2OmaKmsr2fq7WVoKqJlJ1/iZF4gYl0fYRye4Nye4Jze4OJk5yGkZmFj5iFkJiOmKKVoKmns76bp7CXoqyWoavzWb9OAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMlY2/4EwAAASxJREFUGBl9wUlOwmAYBuD37f93wBKxVRPAEdmy0ngBl57FFbdy6QHwAm41VePQmAjGgSAhWIbySQEXBsrzEARJLCMYCUjD4BiIxQQyFguVE2uOIY0YQxmqiKZaYQLpyF7X5xansETXFNEO2XaxnGRGihmrwIlYcWC1sYjtPPV5SPILy62LBFqTYYlv+KfARLOzB/L5gC0tFY0cd7LvJbPnDIamyQAJjzcVst9x7gCYTivXgoFEGfRdLzMK3d2S4xwjizkGvgHcAtb9q5f3fraLUXSFCHP0sMKXNQAf/n7zGg1MbSAsYcY2kf8MjOBCNcUC4HETf8JHHKEHNDAWrkI9CMsnTCCdiOj+Jc84g8UYywRdKZ7GLokUHInmeZ1GVK2LX7NTWXZNtevV6Bdm0m3Li6lEPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-po\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/66f6m4fL2LaJ0YdPRPt2Je/0dd206a14f2bdc97fbac20bba3109c30/airflow-po.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>이 글에서 언급한 설정은 FIXME 주석을 해두었으니 궁금하신분들은 <a href=\"https://github.com/Swalloow/airflow-helm\">https://github.com/Swalloow/airflow-helm</a> 저장소를 확인하시기 바랍니다.</p>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"0d51ef05-306f-56ae-b726-ab2712215dec","title":"여러 조직이 함께 사용하는 Airflow 만들기","slug":"airflow-multi-tenent-1","publishDate":"August 15, 2021","publishDateISO":"2021-08-15","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":6,"html":"<p>사내 데이터가 다양해지고 사용자가 많아지면 접근 제어와 권한 등 다양한 고민이 생기게 됩니다.\n이 글에서는 여러 조직이 함께 사용하는 Airflow를 만들 때 알아두면 좋은 내용들에 대해 정리해보려고 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#airflow-rbac\">Airflow RBAC</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#dag-level-permissions\">DAG-Level Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#connection-variable-access-control\">Connection, Variable Permissions</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-multi-tenent-1/#cluster-policy\">Cluster Policy</a></li>\n</ul>\n<br>\n<h2 id=\"접근-제어가-필요한-경우\" style=\"position:relative;\"><a href=\"#%EC%A0%91%EA%B7%BC-%EC%A0%9C%EC%96%B4%EA%B0%80-%ED%95%84%EC%9A%94%ED%95%9C-%EA%B2%BD%EC%9A%B0\" aria-label=\"접근 제어가 필요한 경우 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>접근 제어가 필요한 경우</h2>\n<p>먼저 접근 제어는 모든 조직에 필요한 내용은 아닙니다. 다만 아래와 같은 경우에는 필요할 수 있습니다.</p>\n<ul>\n<li>다른 사람이 실행, 중지 권한을 가져서는 안될 만큼 중요한 DAG이 존재하는 경우</li>\n<li>민감한 데이터를 다루는 DAG이 존재하는 경우 (HR, 매출 데이터 등)</li>\n<li>팀에서 운영하는 DAG, Connection, Variable을 우리 팀만 보고 싶은 경우</li>\n</ul>\n<p>특히 Airflow Connections, Variable에는 DB 또는 클러스터 접속 정보, API키 등 민감한 정보가 많이 저장됩니다. 물론 마스킹 기능을 통해 UI에서 볼 수 없게 만들 수 있지만 id는 볼 수 있기 때문에 쉽게 값을 가져올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>models <span class=\"token keyword\">import</span> Variable\n<span class=\"token keyword\">from</span> airflow<span class=\"token punctuation\">.</span>hooks<span class=\"token punctuation\">.</span>base_hook <span class=\"token keyword\">import</span> BaseHook\n\nvariable <span class=\"token operator\">=</span> Variable<span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token string\">\"myvar\"</span><span class=\"token punctuation\">)</span>\nconnection <span class=\"token operator\">=</span> BaseHook<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span><span class=\"token string\">\"myconn\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>이 문제를 해결하기 위한 방법으로 조직마다 Airflow 환경을 분리하는 방법이 있습니다.\n하지만 이 방법은 운영과 모니터링이 힘들 수 있어 프라이빗 클라우드를 운영해야하는 상황이 아니라면 추천하지 않습니다. 두 번째 방법은 <strong>Airflow의 RBAC 기능</strong>을 활용하는 방법 입니다.</p>\n<br>\n<h2 id=\"airflow-rbac\" style=\"position:relative;\"><a href=\"#airflow-rbac\" aria-label=\"airflow rbac permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow RBAC</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 26.629834254143645%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAALCAQAAACnzwd+AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH6AEUDTMjigxdJgAAATZJREFUKM+lkj1PwlAYhR8KqGmrEioJRIwSB2cHZ0f/gbtOTk5OOjm5uLk4GTd/ADHGUeMvMNHEEAOopAXFj7S0KA2vQ1FKgos9d7n3ybknb869EFHVbUfs31U3lUhpY2junEaCFh6goxrRAhO42ieMoJEgHqDSmmr0HY2zxRu4XZ5c6jPnbqEIVzOFVWI/zG/vHh75CNIt2Y0g28fGtXAkrPoewFsxzD6uAR43BoxyPAtow4YGoEwGHail0Ym/j6cACyEHdJJk8O6NPE+0gS5ZJjjP0UT5M7DQO06/4kDKBsj2WLLDM8w3IR+6uGKeOEMnNNcHOwQw992LcIcA1VNlK9zhZS3YVTbTO32vZ0V6ZHRiDwcivnhiiy8i9le0b+OjtkYBLF5wwx3+U21QKw4wFZSD2/wG6NCb2GjgR5cAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-rbac\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=226 226w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=453 453w,\nhttps://images.ctfassets.net/tushy4jlcik7/013LcVaNqjXcpl8koBPKo6/a98b75aadeef40c7b09bc083cc61f2ec/airflow-rbac.png?w=905 905w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow RBAC은 1.10 버전부터 추가되었고 2.0 버전부터 기본 설정으로 제공됩니다.\nAirflow의 Security Model은 위의 그림과 같은 구조를 따르고 있습니다.\n사용자는 User, Role로 구성되어 있습니다. 여기서 User는 하나 이상의 Role을 가질 수 있습니다.</p>\n<p>접근 권한은 <strong>Permission, ViewMenu</strong> 그리고 이를 조합한 <strong>PermissionView</strong>로 구성되어 있습니다.\nRole은 여러 개의 Permission을 가질 수 있습니다. PermissionView에 대한 예시는 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.29950319375443%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAAAkFBMVEXg4ODR0dDR0dHQ0NDW1tbQ0M/Ozs3Y2Njk5OT09PTy8vLz8/P4+Pje3t7n5+f19fX29vb7+/v6+vr5+fmxxtzZ4+729/n09vr19/r4+Pnq7fDw8fPx8vPf39/i4uHl5eXw8PD8/Pzt8fb19/nc3Nzb29vZ2dnu7u7+/v7t7e3v7+/////39/fw8O/x8fHv7u6BHJCtAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAJRJREFUKM+NzdcOwjAMhWGzyaCtE/ZMWIG0lPd/O1RxlYHwd2n9Ogbo9QfD0Xgy/QMYJxEgZ0VJUAEqEgSl54vlar2R292e5dfE4XgyYPF8wS+Fv1kQ15sJFXcwCQbKuUdIPuNLB9CXdUg6Xye6sCGGxhPDV/K6rfOLDTEUMropI/NhvKi5sNmwSkKDuZDrOHy3Kg0/kHhQ2pDrkJgAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI4MTjM+LehAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTkyQGubPgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"permissionview\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=705 705w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=1409 1409w,\nhttps://images.ctfassets.net/tushy4jlcik7/09unii6nTbCJk4DK7VK32/2f2b05f6317b7bf671437738d1f22b95/permissionview.png?w=2818 2818w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Connections <strong>ViewMenu</strong> 와 can_edit <strong>Permission</strong> 을 조합하면 <code class=\"language-text\">can edit on Connections</code>라는 <strong>PermissionView</strong> 가 생성됩니다. 이 권한을 가진 사용자만 Connections UI에서 편집을 할 수 있습니다. 이러한 방식을 Airflow에서는 <strong>Resource-Based permissions</strong>라고 정의하고 있습니다.</p>\n<p>Airflow에는 다양한 리소스에 대해 권한이 이미 정의되어 있고, 기본적으로 Admin을 포함한 5개의 Role을 제공합니다. 조직마다 다른 Role을 가지고 싶은 경우, BaseRole을 정의하고 Copy Role을 통해 새로 만들면 편하게 운영할 수 있습니다.</p>\n<p>리소스 기반의 권한 제어도 필요하지만 이 기능에서는 DAGs 라는 단일 리소스로 보고 있기 때문에 DAG 단위로 접근 제어를 할 수 없습니다. 이를 지원하기 위해 2.0+ 버전부터 <strong>DAG-level Permission</strong>이 추가되었습니다.</p>\n<br>\n<h2 id=\"dag-level-permissions\" style=\"position:relative;\"><a href=\"#dag-level-permissions\" aria-label=\"dag level permissions permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>DAG-level Permissions</h2>\n<p>DAG-level Permission을 사용하면 다음과 같은 접근 제어를 할 수 있습니다.</p>\n<ul>\n<li>A 사용자는 A 사용자의 DAG만 볼 수 있음</li>\n<li>A 사용자는 B 사용자의 DAG을 볼 수 없음</li>\n<li>B 사용자가 A 사용자에게 권한을 부여하면 볼 수 있음</li>\n</ul>\n<p>DAG-level Permission은 앞서 얘기했던 리소스 기반 접근 제어에 <code class=\"language-text\">DAG:dag_id</code>라는 리소스를 추가하는 방식으로 구현되었습니다. 예를 들어 A 사용자와 B 사용자에게 example DAG에 대한 읽기 권한을 부여하고 싶은 경우, <code class=\"language-text\">DAG:example.can_read</code>라는 권한을 추가해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">with</span> DAG<span class=\"token punctuation\">(</span>\n    <span class=\"token string\">\"example_dag\"</span><span class=\"token punctuation\">,</span>\n    default_args<span class=\"token operator\">=</span>default_args<span class=\"token punctuation\">,</span>\n    description<span class=\"token operator\">=</span><span class=\"token string\">\"example dags\"</span><span class=\"token punctuation\">,</span>\n    schedule_interval<span class=\"token operator\">=</span><span class=\"token string\">\"@once\"</span><span class=\"token punctuation\">,</span>\n    access_control<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"myrole\"</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span><span class=\"token string\">\"can_dag_read\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">,</span>\n    start_date<span class=\"token operator\">=</span>days_ago<span class=\"token punctuation\">(</span><span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span>\n<span class=\"token punctuation\">)</span> <span class=\"token keyword\">as</span> dag<span class=\"token punctuation\">:</span></code></pre></div>\n<p>위와 같이 DAG을 정의하는 단계에서도 <code class=\"language-text\">access_control</code> 파라메터를 통해 DAG의 접근 권한을 정의해주어야 합니다. 이후 BaseRole에 DAGs 리소스 접근 권한을 제거하면 사용자는 오직 허용된 DAG에 대해서만 접근할 수 있게 됩니다.</p>\n<p>DAG access_control이 변경될 때마다 Role에 권한을 추가하는 일은 보통 번거로운 일이 아닙니다. 이를 위해 Airflow에서는 <code class=\"language-text\">airflow sync-perm</code> 이라는 명령어를 제공합니다. 해당 명령어를 실행하면 모든 DAG에 정의된 권한이 연관된 Role에 반영됩니다. Permission Sync 사이드카 컨테이너를 webserver에 배포하면 이 과정을 자동화할 수 있습니다. 관련 내용은 <a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">사이드카 컨테이너로 Airflow 기능 확장하기</a> 글을 참고해주시면 됩니다.</p>\n<br>\n<h2 id=\"connection-variable-access-control\" style=\"position:relative;\"><a href=\"#connection-variable-access-control\" aria-label=\"connection variable access control permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Connection, Variable Access Control</h2>\n<p>앞서 DAG-level Permission을 보셨다면 느끼셨겠지만 Connection, Variable 또한 각 변수에 대해 접근 제어를 할 수 없고 관련 기능도 없습니다. 하지만 <strong>Alternative Secrets Backend</strong> 라는 기능을 통해 Custom Backend 클래스를 만들면 접근 제어를 구현할 수 있습니다.</p>\n<br>\n<h3 id=\"alternative-secrets-backend\" style=\"position:relative;\"><a href=\"#alternative-secrets-backend\" aria-label=\"alternative secrets backend permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Alternative Secrets Backend</h3>\n<p>원래 Connection, Variable은 Meta DB에 저장됩니다. 하지만 이 기능을 사용하면 AWS Parameter Store, Vault 등 외부 자원을 저장소로 사용할 수 있습니다. airflow에 구현된 코드는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@classmethod</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">get_connection_from_secrets</span><span class=\"token punctuation\">(</span>cls<span class=\"token punctuation\">,</span> conn_id<span class=\"token punctuation\">:</span> <span class=\"token builtin\">str</span><span class=\"token punctuation\">)</span> <span class=\"token operator\">-</span><span class=\"token operator\">></span> <span class=\"token string\">'Connection'</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"\n    Get connection by conn_id.\n    :param conn_id: connection id\n    :return: connection\n    \"\"\"</span>\n    <span class=\"token keyword\">for</span> secrets_backend <span class=\"token keyword\">in</span> ensure_secrets_loaded<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        conn <span class=\"token operator\">=</span> secrets_backend<span class=\"token punctuation\">.</span>get_connection<span class=\"token punctuation\">(</span>conn_id<span class=\"token operator\">=</span>conn_id<span class=\"token punctuation\">)</span>\n        <span class=\"token keyword\">if</span> conn<span class=\"token punctuation\">:</span>\n            <span class=\"token keyword\">return</span> conn\n    <span class=\"token keyword\">raise</span> AirflowNotFoundException<span class=\"token punctuation\">(</span><span class=\"token string-interpolation\"><span class=\"token string\">f\"The conn_id `</span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>conn_id<span class=\"token punctuation\">}</span></span><span class=\"token string\">` not defined\"</span></span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p><code class=\"language-text\">BaseHook</code>에서 호출하는 <code class=\"language-text\">get_connection_from_secrets</code> 메서드는 여러 backend로부터 conn_id에 대한 값을 받아오고 리턴합니다. 즉 기존 Meta DB를 사용하고 있더라도 유지하면서 새로운 backend와 호환 가능합니다.</p>\n<p>AWS Parameter Store는 Path 단위로 키를 다르게 값을 저장할 수 있습니다.\n이 점을 활용해서 id 상위 경로로 role을 지정한다면 role 단위로 접근 제어가 가능해집니다.\n접근 제어를 위한 AWS Parameter Store에 저장되는 규칙은 아래와 같습니다.\nAirflow 환경, 역할 별로 구분해서 저장합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">secrets</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">backend</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"airflow...SystemsManagerParameterStoreBackend\"</span>\n    <span class=\"token key atrule\">backend_kwargs</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n        <span class=\"token key atrule\">\"connections_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/connections\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"variables_prefix\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/airflow/prod/variables\"</span><span class=\"token punctuation\">,</span>\n        <span class=\"token key atrule\">\"profile_name\"</span><span class=\"token punctuation\">:</span> <span class=\"token null important\">null</span>\n    <span class=\"token punctuation\">}</span></code></pre></div>\n<ul>\n<li>/airflow/prod/connections/myrole/connection_id</li>\n<li>/airflow/prod/variables/myrole/variable_id</li>\n</ul>\n<p>기본으로 제공하는 Connections, Variables UI는 세부 경로로 값을 가져오는게 아니기 때문에 secrets backend 설정과 함께 Custom UI Plugin이 필요합니다.</p>\n<br>\n<h2 id=\"access-control-ui-plugin\" style=\"position:relative;\"><a href=\"#access-control-ui-plugin\" aria-label=\"access control ui plugin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Access Control UI Plugin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 23.714585519412385%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAK0WlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkIEpITeBOkEkBJ6KNKrqIQkkFBiTAgiYmdwBMeCiAiWERVBFBwdARkLYsHCoNhARQdkEFDWwYKoqOwPLGFm9uzu2Ztz877c3HfLO+/PuQGAEsQRi9NhJQAyRJmScD9PRmxcPAPXD/BAEagCe6DN4UrFrNDQIIDIzPpX+fAQQJPrPYvJWP/+/X8VFR5fygUASkA4iSflZiDcjOhrrliSCQDqJGLXX5EpnuT7CNMkSIEID05yyjR/meSkKUYrTflEhnshbAAAnszhSFIAIFshdkYWNwWJQw5F2ErEE4oQXoewG1fA4SGM5AXzMjKWTfIwwiaIvxgACg1hZtKfYqb8JX6SPD6HkyLn6b6mBO8tlIrTOSv/z6P535KRLpvJYYQoWSDxD0dWOnJ+XWnLAuUsSloYMsNC3pT/FAtk/lEzzJV6xc8wj+MdKN+bvjBohpOFvmx5nEx25AzzpT4RMyxZFi7PlSzxYs0wRzKbV5YWJbcL+Gx5/BxBZMwMZwmjF86wNC0icNbHS26XyMLl9fNFfp6zeX3lvWdI/9SvkC3fmymI9Jf3zpmtny9izcaUxspr4/G9fWZ9ouT+4kxPeS5xeqjcn5/uJ7dLsyLkezORyzm7N1R+hqmcgNAZBt7ABwQhLwYIBTbAEVFrEAZAJj87c7IZr2XilRJhiiCTwUKeOD6DLeJazmPYWNlYAzD5/E5fiXddU88lRMfP2kTFADgMIMbsWVuiAgBn25Droz1rM7EDQDEYgKu7uTJJ1rQNPfmGAUTkl4EG1IE20AcmwAKpzQG4AA+k4gAQAiJBHFgCuEAAMoAErAC5YD3IB4VgO9gFysABcAhUgRPgFGgA58AlcA3cAnfAA/AE9IB+8AqMgA9gHIIgHESBqJA6pAMZQuaQDcSE3CAfKAgKh+KgRCgFEkEyKBfaCBVCRVAZdBCqhn6CzkKXoBtQB/QI6oWGoLfQZxgFk2EarAUbwfNhJsyCA+FIeDGcAi+Hc+A8eCtcClfAx+F6+BJ8C34A98Cv4FEUQJFQdJQuygLFRHmhQlDxqGSUBLUGVYAqQVWgalFNqFbUPVQPahj1CY1FU9EMtAXaBe2PjkJz0cvRa9Bb0GXoKnQ9+gr6HroXPYL+hqFgNDHmGGcMGxOLScGswORjSjCVmDOYq5gHmH7MBywWS8caYx2x/tg4bCp2FXYLdh+2DtuM7cD2YUdxOJw6zhznigvBcXCZuHzcHtxx3EXcXVw/7iOehNfB2+B98fF4EX4DvgR/DH8Bfxc/gB8nKBEMCc6EEAKPsJKwjXCY0ES4TegnjBOVicZEV2IkMZW4nlhKrCVeJXYT35FIJD2SEymMJCStI5WSTpKuk3pJn8gqZDOyFzmBLCNvJR8lN5Mfkd9RKBQjigclnpJJ2UqpplymPKN8VKAqWCqwFXgKaxXKFeoV7iq8ViQoGiqyFJco5iiWKJ5WvK04rERQMlLyUuIorVEqVzqr1Kk0qkxVtlYOUc5Q3qJ8TPmG8qAKTsVIxUeFp5KnckjlskofFUXVp3pRudSN1MPUq9R+GpZmTGPTUmmFtBO0dtqIqoqqnWq0arZquep51R46im5EZ9PT6dvop+gP6Z/naM1hzeHP2Tynds7dOWNqc9U81PhqBWp1ag/UPqsz1H3U09R3qDeoP9VAa5hphGms0NivcVVjeC5trstc7tyCuafmPtaENc00wzVXaR7SbNMc1dLW8tMSa+3Ruqw1rE3X9tBO1S7WvqA9pEPVcdMR6hTrXNR5yVBlsBjpjFLGFcaIrqauv65M96Buu+64nrFelN4GvTq9p/pEfaZ+sn6xfov+iIGOQbBBrkGNwWNDgiHTUGC427DVcMzI2CjGaJNRg9GgsZox2zjHuMa424Ri4m6y3KTC5L4p1pRpmma6z/SOGWxmbyYwKze7bQ6bO5gLzfeZd8zDzHOaJ5pXMa/TgmzBssiyqLHotaRbBllusGywfD3fYH78/B3zW+d/s7K3Src6bPXEWsU6wHqDdZP1WxszG65Nuc19W4qtr+1a20bbN3bmdny7/XZd9lT7YPtN9i32Xx0cHSQOtQ5DjgaOiY57HTuZNGYocwvzuhPGydNprdM5p0/ODs6Zzqec/3CxcElzOeYyuMB4AX/B4QV9rnquHNeDrj1uDLdEtx/detx13TnuFe7PPfQ9eB6VHgMsU1Yq6zjrtaeVp8TzjOeYl7PXaq9mb5S3n3eBd7uPik+UT5nPM1893xTfGt8RP3u/VX7N/hj/QP8d/p1sLTaXXc0eCXAMWB1wJZAcGBFYFvg8yCxIEtQUDAcHBO8M7l5ouFC0sCEEhLBDdoY8DTUOXR76Sxg2LDSsPOxFuHV4bnhrBDViacSxiA+RnpHbIp9EmUTJolqiFaMToqujx2K8Y4piemLnx66OvRWnESeMa4zHxUfHV8aPLvJZtGtRf4J9Qn7Cw8XGi7MX31iisSR9yfmliks5S08nYhJjEo8lfuGEcCo4o0nspL1JI1wv7m7uK54Hr5g3xHflF/EHkl2Ti5IHU1xTdqYMCdwFJYJhoZewTPgm1T/1QOpYWkja0bSJ9Jj0ugx8RmLGWZGKKE10ZZn2suxlHWJzcb64Z7nz8l3LRySBkkopJF0sbcykIYNSm8xE9p2sN8stqzzr44roFaezlbNF2W0rzVZuXjmQ45tzZBV6FXdVS65u7vrc3tWs1QfXQGuS1rSs1V+bt7Z/nd+6qvXE9Wnrf91gtaFow/uNMRub8rTy1uX1fef3XU2+Qr4kv3OTy6YD36O/F37fvtl2857N3wp4BTcLrQpLCr9s4W65+YP1D6U/TGxN3tq+zWHb/u3Y7aLtD3e476gqUi7KKerbGbyzvphRXFD8ftfSXTdK7EoO7Cbulu3uKQ0qbdxjsGf7ni9lgrIH5Z7ldXs1927eO7aPt+/ufo/9tQe0DhQe+Pyj8Meug34H6yuMKkoOYQ9lHXpxOPpw6xHmkepKjcrCyq9HRUd7qsKrrlQ7Vlcf0zy2rQaukdUMHU84fueE94nGWovag3X0usKT4KTs5MufEn96eCrwVMtp5unanw1/3nuGeqagHqpfWT/SIGjoaYxr7DgbcLalyaXpzC+Wvxw9p3uu/Lzq+W0XiBfyLkxczLk42ixuHr6UcqmvZWnLk8uxl+9fCbvSfjXw6vVrvtcut7JaL153vX7uhvONszeZNxtuOdyqb7NvO/Or/a9n2h3a62873m6843SnqWNBx4W77ncv3fO+d+0++/6tBwsfdDyMetjVmdDZ08XrGnyU/ujN46zH40/WdWO6C54qPS15pvms4jfT3+p6HHrO93r3tj2PeP6kj9v36nfp71/6815QXpQM6AxUD9oMnhvyHbrzctHL/lfiV+PD+f9Q/sfe1yavf/7D44+2kdiR/jeSNxNvt7xTf3f0vd37ltHQ0WcfMj6MjxV8VP9Y9Yn5qfVzzOeB8RVfcF9Kv5p+bfoW+K17ImNiQsyRcKZGARSicHIyAG+PIvNxHADUOwAQF03P11MCTf8nmCLwn3h6Bp8SBwCqPACIRHRyfDyCqDGiCsjn0Gk7bGsr13+JNNnWZjoWqQEZTUomJt4h8yPOFICvnRMT4w0TE18rkWIfA9D8YXqunxSl4wC80WdZBQZ1462zwd9keub/U49/X8FkBXbg7+s/AVY2GCxWCu1FAAAAkFBMVEXc5Oba7ev5+fnz8/L4+Pjw8O/6+vry8fH19fX29vX8/Pz////z8/P29fbm8v38/f/o6Ojd3d3c3Nvp6enu7u729vbk5OTy8vL09PTz9/rp8Pf39/fi7/rJ4fXz9ff29/jr6+vs7Ozt7u/o6uzk5+rp6+3t7vDi5unj5+nj5un7+/v19vfx8fH+/v79/f38/P2cLAWqAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUDTMjigxdJgAAAIFJREFUGBmNwUkWgjAQBcA2tnH43xlERUUDOCCB+99OWLLwQZXIyIx1YqdmNl/gDy5Xa9lsd/sBAgkP0XEAldNZ+8Wxlcv1lpge8f1hRSPSpSSznK3ny5HOMY+YZSTT94cNI8U3gQYFQKvoKtEoPVqVVHWNQj0QqqLLomE9Wl78QD8dcxm5bOTFqgAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzgxMpSROdoAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwNNJDNLoAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMX297iYAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"conn ui\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=953 953w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=1906 1906w,\nhttps://images.ctfassets.net/tushy4jlcik7/337N55s9zxw4kLX05D86AE/ad82d3f0c515e3dddb1dfff42642412c/conn_ui.png?w=3812 3812w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>플러그인의 역할은 다음과 같습니다. myrole이라는 Airflow Role을 가진 사용자가 Connections UI 페이지에 접근하면 Custom Backend를 통해 Paramter Store의 <code class=\"language-text\">/airflow/prod/connections/myrole</code> 경로 하위의 값들을 받아오도록 요청해야 합니다. list 뿐만 아니라 create, edit, delete에 대한 기능도 추가해주어야 합니다.</p>\n<p>이를 위해 UI 플러그인에서 현재 접속한 사용자의 Role 이름을 받아올 수 있어야 합니다. 이 때 flask의 global session을 활용하면 쉽게 받아올 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> flask <span class=\"token keyword\">import</span> g\n\nrole_name <span class=\"token operator\">=</span> g<span class=\"token punctuation\">.</span>user<span class=\"token punctuation\">.</span>roles<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>name</code></pre></div>\n<p>이제 UI에서 추가, 편집, 삭제 시 Secrets Backend를 통해 AWS Parameter Store에 반영됩니다. 오직 권한을 가진 사용자만이 DAG, Connection, Variable에 접근할 수 있습니다.</p>\n<br>\n<h2 id=\"cluster-policy\" style=\"position:relative;\"><a href=\"#cluster-policy\" aria-label=\"cluster policy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Cluster Policy</h2>\n<p>DAG 작성에 대한 가이드가 있더라도 모두 만족하는지 체크하는건 상당히 번거로운 일 입니다.\nAirflow 2.0+에서는 Cluster Policy를 통해 클러스터 전체에서 DAG 또는 task에 대한 정책을 정의하고 강제하도록 설정할 수 있습니다. 예를 들면 다음과 같은 정책을 정의할 수 있습니다.</p>\n<ul>\n<li>모든 DAG에는 적어도 하나의 태그를 달아야 한다</li>\n<li>특정 task의 timeout은 48시간을 넘을 수 없다</li>\n</ul>\n<p><code class=\"language-text\">airflow_local_settings.py</code> 파일을 만들고 정의하면 적용할 수 있습니다.\n태그를 강제하는 정책 예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">dag_policy</span><span class=\"token punctuation\">(</span>dag<span class=\"token punctuation\">:</span> DAG<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token triple-quoted-string string\">\"\"\"Ensure that DAG has at least one tag\"\"\"</span>\n    <span class=\"token keyword\">if</span> <span class=\"token keyword\">not</span> dag<span class=\"token punctuation\">.</span>tags<span class=\"token punctuation\">:</span>\n        <span class=\"token keyword\">raise</span> AirflowClusterPolicyViolation<span class=\"token punctuation\">(</span>\n            <span class=\"token string-interpolation\"><span class=\"token string\">f\"DAG </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>dag_id<span class=\"token punctuation\">}</span></span><span class=\"token string\"> has no tags. At least one tag required. File path: </span><span class=\"token interpolation\"><span class=\"token punctuation\">{</span>dag<span class=\"token punctuation\">.</span>filepath<span class=\"token punctuation\">}</span></span><span class=\"token string\">\"</span></span>\n        <span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 정책이 적용된 클러스터에 태그가 없는 DAG을 배포하는 경우, <code class=\"language-text\">AirflowClusterPolicyViolation</code> 오류가 발생하기 때문에 DAG을 등록할 수 없습니다.\n자세한 내용은 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/concepts/cluster-policies.html\">공식문서</a>를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>최근 Airflow Summit에서 Multi-Tenent와 관련된 영상들이 많이 올라와서 함께 참고하면 도움이 될 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/access-control.html</a></li>\n<li><a href=\"https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821\">https://eng.lyft.com/securing-apache-airflow-ui-with-dag-level-access-a7bc649a2821</a></li>\n<li><a href=\"https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html\">https://airflow.apache.org/docs/apache-airflow/stable/security/secrets/secrets-backend/index.html</a></li>\n</ul>","excerpt":"…"}}},{"id":"685d6694-ca41-5c2f-89a2-86556223c62c","title":"Spark 2.2.0 릴리즈 업데이트 정리","slug":"spark22","publishDate":"July 14, 2017","publishDateISO":"2017-07-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>7월 11일 약 2개월 만에 Spark 2.2.0이 릴리즈 되었습니다.\n어떤 변경 사항들이 있었는지 릴리즈 노트를 통해 간략하게 정리해보았습니다.</p>\n<br>\n<h2 id=\"pypi-를-통한-pyspark-설치\" style=\"position:relative;\"><a href=\"#pypi-%EB%A5%BC-%ED%86%B5%ED%95%9C-pyspark-%EC%84%A4%EC%B9%98\" aria-label=\"pypi 를 통한 pyspark 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pypi 를 통한 PySpark 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">pip <span class=\"token function\">install</span> pyspark</code></pre></div>\n<p>드디어 PySpark이 <code class=\"language-text\">pip</code>을 지원하게 되었습니다.\n<code class=\"language-text\">pip install pyspark</code> 명령어를 통해 쉽게 설치 가능합니다.\n설치된 버전은 Spark 2.2.0 버전 입니다.</p>\n<p><code class=\"language-text\">numpy, pandas</code> 파이썬 패키지에 dependency가 있으며,\n자세한 사항은 <a href=\"https://pypi.python.org/pypi/pyspark\">pypi 패키지 링크</a>를 통해 확인하실 수 있습니다.\n이번 업데이트를 통해 standalone cluster에서 누구나 쉽게 사용해 볼 수 있을 듯 합니다.</p>\n<br>\n<h2 id=\"structured-streaming\" style=\"position:relative;\"><a href=\"#structured-streaming\" aria-label=\"structured streaming permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Structured Streaming</h2>\n<p>이번 버전부터 Structured Streaming이 새로 추가 되었습니다.\nStructured Streaming은 스트리밍 어플리케이션을 더 빠르고 쉽게 개발하기 위해 만들어진 패키지입니다.</p>\n<p>Spark Streaming이 내부적으로 RDD API를 지원하는 반면, Structured Streaming은 DataFrame, Dataset API를 지원합니다.\n언어는 Scala, Java, Python 모두 지원하며, <code class=\"language-text\">readStream</code> 이라는 메서드를 통해 다양한 저장소로부터 데이터를 읽을 수 있습니다.\n특히 이번 업데이트를 통해 Apache Kafka 스트리밍 지원이 추가되었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># Subscribe to 1 topic</span>\ndf <span class=\"token operator\">=</span> spark \\\n  <span class=\"token punctuation\">.</span>readStream \\\n  <span class=\"token punctuation\">.</span><span class=\"token builtin\">format</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"kafka.bootstrap.servers\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"host1:port1,host2:port2\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>option<span class=\"token punctuation\">(</span><span class=\"token string\">\"subscribe\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"topic1\"</span><span class=\"token punctuation\">)</span> \\\n  <span class=\"token punctuation\">.</span>load<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>selectExpr<span class=\"token punctuation\">(</span><span class=\"token string\">\"CAST(key AS STRING)\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"CAST(value AS STRING)\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>Structured Streaming에 대한 자세한 내용은 <a href=\"http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html\">http://spark.apache.org/docs/2.2.0/structured-streaming-programming-guide.html</a> 에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"mllib\" style=\"position:relative;\"><a href=\"#mllib\" aria-label=\"mllib permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MLlib</h2>\n<p>예상했던 대로 MLlib에도 많은 변화가 생겼습니다.\nRDD-based MLlib이 아니라 DataFrame-based MLlib을 확인하시면 됩니다.</p>\n<ul>\n<li>기존에 scala API만 지원하던 모델들에 <code class=\"language-text\">python, R API</code>가 추가되었습니다.</li>\n<li>지원이 추가된 모델은 <strong>Gradient Boosted Trees, Bisecting K-Means, LSH, Distributed PCA, SVD</strong> 입니다.</li>\n<li>DataFreame-based MLlib에 새로운 모델이 추가되었습니다.</li>\n<li>추가된 모델은 **LinearSVC (Linear SVM Classifier), ChiSquare test, Correlation,</li>\n</ul>\n<p>Imputer feature transformer, Tweedie distribution, FPGrowth frequent pattern mining, AssociationRules** 입니다.</p>\n<br>\n<h2 id=\"sparkr\" style=\"position:relative;\"><a href=\"#sparkr\" aria-label=\"sparkr permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SparkR</h2>\n<p>이번 업데이트를 통해 SparkR에서 Spark SQL API가 확대되었습니다.</p>\n<ul>\n<li>R API에 Structured Streaming, Catalog가 추가되었습니다.</li>\n<li>to_json, from_json 메서드가 추가되었습니다.</li>\n<li>Coalesce, DataFrame checkpointing, Multi-column approxQuantile 기능이 추가되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"graphx\" style=\"position:relative;\"><a href=\"#graphx\" aria-label=\"graphx permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GraphX</h2>\n<p>GraphX는 버그 수정, 최적화 업데이트가 추가되었습니다.\n이번 Structured Steaming이 메인에 추가된 것으로 보아,\n추후에 DataFrame, DataSet API 기반의 GraphFrame이 추가될 수도 있다고 예상합니다.</p>\n<ul>\n<li>PageRank, vertexRDD/EdgeRDD checkpoint 버그를 수정했습니다.</li>\n<li>PageRank, Pregel API가 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"core-and-sparksql-deprecations\" style=\"position:relative;\"><a href=\"#core-and-sparksql-deprecations\" aria-label=\"core and sparksql deprecations permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Core and SparkSQL, Deprecations</h2>\n<p>마지막으로 Core, SparkSQL 그리고 Deprecation 업데이트 입니다.\n전체 업데이트 및 기타 자세한 내용은 맨 아래의 링크를 참고하시면 됩니다.</p>\n<ul>\n<li>Python 2.6, Java 7, Hadoop 2.5 지원이 종료되었습니다.</li>\n<li><code class=\"language-text\">ALTER TABLE table_name ADD COLUMNS</code> 구문이 추가되었습니다.</li>\n<li>Cost-Based Optimizer 성능이 개선되었습니다.</li>\n<li>CSV, JSON 포멧의 File listing/IO 성능이 개선되었습니다.</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://spark.apache.org/releases/spark-release-2-2-0.html\">http://spark.apache.org/releases/spark-release-2-2-0.html</a></li>\n</ul>\n<br>","excerpt":"7월 11일 약 2개월 만에 Spark 2.2.…"}}},{"id":"dac34ae1-16f1-5a77-9cc9-62b364430ad7","title":"빅데이터 처리에 Scala가 필요한 이유","slug":"scala-for-bigdata","publishDate":"March 17, 2017","publishDateISO":"2017-03-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>StackOverFlow나 Quora를 보면 <strong>Scala has taken over the Big Data world.</strong> 라는 글을 많이 볼 수 있습니다.\n게다가 Spark의 엔진은 Scala로 구현되어 있습니다. 이 포스팅에서는 데이터를 다루는데에 스칼라가 가지는 강점이 무엇인지 알아보고자 합니다.</p>\n<br>\n<h1 id=\"scala가-가지는-강점\" style=\"position:relative;\"><a href=\"#scala%EA%B0%80-%EA%B0%80%EC%A7%80%EB%8A%94-%EA%B0%95%EC%A0%90\" aria-label=\"scala가 가지는 강점 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala가 가지는 강점</h1>\n<h2 id=\"static-typing-type-inference\" style=\"position:relative;\"><a href=\"#static-typing-type-inference\" aria-label=\"static typing type inference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Static Typing, Type Inference</h2>\n<p>스칼라의 <code class=\"language-text\">val</code> 변수는 한번 지정된 값을 바꾸지 않습니다.\n이러한 변수를 <code class=\"language-text\">Immutable variable</code> 이라고 부릅니다. 예를 들면 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Hello Scala\"</span>\n<span class=\"token builtin\">String</span> <span class=\"token operator\">=</span> Hello Scala\n\n<span class=\"token keyword\">val</span> msg <span class=\"token operator\">=</span> <span class=\"token string\">\"Reassign to val\"</span>\nerror<span class=\"token operator\">:</span> reassignment to <span class=\"token namespace\">val</span></code></pre></div>\n<p>위의 예제를 보면, msg 변수에 문자열을 할당했지만 어디에도 String 이라는 단어는 없습니다.\n스칼라는 알아서 타입을 추론하여 지정해주기 때문입니다.\n따라서, <code class=\"language-text\">val</code> 변수에 재할당을 시도하면 <code class=\"language-text\">reassignment to val</code> 이라는 오류가 발생하게 됩니다.</p>\n<p>이처럼 스칼라는 input 타입을 보고 함수나 출력 값의 타입을 추론해주며 이를 통해 코드를 깔끔하게 유지할 수 있습니다. 또한, 다양하고 많은 데이터가 사용되는 경우 정적변수가 문제를 단순화 해주는 효과가 있습니다.</p>\n<br>\n<h2 id=\"scalable-language\" style=\"position:relative;\"><a href=\"#scalable-language\" aria-label=\"scalable language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scalable Language</h2>\n<p>기존의 Hadoop 기반의 데이터 인프라는 자바 언어를 통해 MapReduce 연산 그리고 알고리즘을 구현해야했습니다.\n하지만 자바는 코드가 너무 길어 생산성 그리고 가독성이 매우 떨어집니다.</p>\n<p>스칼라는 모든 것들이 일관성있게 그리고 간결하게 구현되도록 설계되었습니다.\n이를 통해 얻을 수 있는 장점은 <strong>\"적은 양의 코드로 방대한 규모의 시스템을 작성할 수 있다\"</strong> 는 것입니다.</p>\n<p>연산자를 예로 들어보겠습니다.\n자바에서는 '==' 와 같은 비교연산자를 제공합니다.\n하지만 비교연산자는 주소값을 비교하기 때문에\nString과 같은 객체를 비교할 때는 <code class=\"language-text\">equal()</code> 메서드를 사용해서 비교해야 했습니다.\n이 또한 스칼라의 Scalable과 거리가 멉니다.\n스칼라에서는 모든 것이 Object이기 때문에 <code class=\"language-text\">==</code> 로 모든 비교가 가능합니다.</p>\n<br>\n<h2 id=\"object-oriented-functional-language\" style=\"position:relative;\"><a href=\"#object-oriented-functional-language\" aria-label=\"object oriented functional language permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Object Oriented, Functional Language</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">y1 = 2x + 5\ny2 = 4(y1) = 4(2x + 5)</code></pre></div>\n<p>함수형 언어를 이해하기 전에 어렸을 때 배웠던 함수식을 떠올려보겠습니다.\n위의 식에서 x는 input, y는 output이 됩니다.\n우리는 어떤 함수에 input을 넣으면 output이 나온다고 이해하고 있습니다.\n그리고 아래의 식처럼 함수를 인자로 넣을 수도 있습니다 (합성함수).\n함수형 언어도 이와 비슷합니다.</p>\n<p>스칼라는 객체지향 프로그래밍과 함수형 프로그래밍을 모두 완벽하게 지원하는 언어입니다.\n스칼라에서는 모든 것이 객체이며 함수가 <code class=\"language-text\">first object</code> 입니다.\n함수를 마치 하나의 값으로 취급하며 이를 변수 또는 파라미터로 넘길 수 있습니다.</p>\n<p>모든 것을 함수로 해결하면 의도하지 않은 동작(Side Effect)이 발생할 일이 없고,\n한번 검증된 함수는 신뢰할 수 있기 때문에 버그가 줄어드는 효과가 있습니다.\n또한, Immutable 변수는 문제를 단순화시켜주기 때문에 데이터 공유, 병렬처리에 강합니다.</p>\n<br>\n<h2 id=\"java와-scala를-비교해보자\" style=\"position:relative;\"><a href=\"#java%EC%99%80-scala%EB%A5%BC-%EB%B9%84%EA%B5%90%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"java와 scala를 비교해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Java와 Scala를 비교해보자</h2>\n<p>Scala는 Interactive한 Shell을 제공합니다.\n이렇게 바로 확인할 수 있는 Shell을 통해 데이터의 탐색적 분석이 가능합니다.\nIntelliJ IDEA에서도 <code class=\"language-text\">Worksheet</code>이라는 기능을 통해 사용할 수 있습니다.\n스칼라 개발환경은 <strong>Scala 2.12.1</strong> 이며, IDE는 <strong>IntelliJ IDEA</strong> 를 사용하였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.60859188544153%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAJGUExURUZJS0NHSkdJS0BCRD9BQ0JFR0hLTEZISj5BQkFDRE9LS05PUVBSU0VHSEpOT2BWVlpdX1hcXk5SUz5BQz1AQkNGSE1aYVlcX1pcXllbXFBTVExPUUJERj1TRjxBQUZZY0hTWUBDRU5PUFBSVFJUVlFTVVNVVkxNTlJVV1FUVjw/QUpMTktdZVNWVzs+QDY5OzY4Oj1ITV9RUEdUajNiuFt+wTtnuTFgtzpgqDxSWk5QUklLTTY3OTAxMjY8Nzg6PBkuP0xMVDNCTz1GUj1FUjtDUDtEUDxEUD9GUzpBTFBXXVNUVlJUVT9BQjw+QDM1NisrKy4vLzU8QUtUWkxSV0FHS1NTXFJVVkRGR2NkazQ1Ni8vME5cXEdLTUZOU1RXWE5TVlFTVkFDRTU3ODAwMDMzMzo9Pz1AQ1RWWE1PUVNWWD9CREBBQ1JTVT1BQ09RU1NVV0tNT0ZZYUxNT0tKSFRWV01QUlZYWUFCRENGSUJERT0/QVZVUkxPUD1AQUtZTE1OUFBRU0xOUENERkpSTFBTVU9SU09RUklWS1VWWFRVVz5AQk5RUlZYWk5QUVxOSE9QUkdKTEJFSUJiiEtfhVBki1Jmi0tfh0pfhjlOdzdNdjA9Vjo9QltZgFNsmlZsmVVtmlpwmlhumERfkjRUjy9BZD5CRFdZWkNFR1JQUlFSVDxAQj9CQzo8Pj5QVz5AQVFUVU5RU1VXWFVXWURHSFZYUVFTVEVHSUBER1pja0RFRzs8PU9UWFZZWiwtLi0tLi0uLiwsLOp3b8MAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAAB4klEQVQoz2NkYASDf8yMyIABAzCKQqVe/5SFqwLiP6y/PoqhKNQCin7hBTOxmIMALAwvZRmFUGwDsd8LvWdgEEIWYxETY4C6CqoWyL79XEJAEFXzTRYhiLrLYL4KEF83ZvwnznjAmYGB+xtcIRcDI3voh5sWjIxnXohDhO4pfHFhZDwBYloimXiUUQtI2YDMnJ22H2TiOQOFL0fVlB6i+o7xJhOYZmdg25nN5gpium1/JMTAcF9RSRXd1yDAxs7IuvkHFyuQuaCUkfH7jnKgYbr3v6GEI0i13221d8JrIJ65ag8O+dPYrLbg0OM8vyr2VaAuELgt5FzMwbHDlgGb1a+YZIIZ54itB5kozcbOMJchgwk9rsG+XheyN2cmNBwZXOBJYytygEMYa740A8l0SOBiTUMQhZMYT+5+CRPiYZz4yscqktELRSWzKJCQU63WMdK+n7/8zysgWChw/v8dqYclT5B9/RbqxvcMK/dv+wyx2ohx994s+TPAUEeEI+NhiEIOeWXG/UIrQJ7Zuj7QW0lw56UUqQ9XMaPwp9qBoz8Wd4GFKsvTby8uWLVF9wpK8EAUBm798fUQaxmI6SXwguVWKk/utOm6ORjhyNLH+GXf1u/pK8DhGA9Ms//BhvQjWQ0Af42LDIQrANwAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"intellij\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=419 419w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=838 838w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hteV58l1Gx4jzFo1xmt4s/3dbd390ecd4bec17a4a022c82b811d41/intellij.png?w=1676 1676w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>간단한 WordCount 예제를 통해 코드를 비교해보곘습니다.</p>\n<h2 id=\"java-hadoop-word-count\" style=\"position:relative;\"><a href=\"#java-hadoop-word-count\" aria-label=\"java hadoop word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>JAVA Hadoop Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"java\"><pre class=\"language-java\"><code class=\"language-java\"><span class=\"token comment\">//package org.myorg;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">IOException</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>fs<span class=\"token punctuation\">.</span></span><span class=\"token class-name\">Path</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>conf<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>io<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>mapred<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n<span class=\"token keyword\">import</span> <span class=\"token import\"><span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>hadoop<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span><span class=\"token operator\">*</span></span><span class=\"token punctuation\">;</span>\n\n<span class=\"token keyword\">public</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">WordCount</span> <span class=\"token punctuation\">{</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Map</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Mapper</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">LongWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token keyword\">final</span> <span class=\"token keyword\">static</span> <span class=\"token class-name\">IntWritable</span> one <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token keyword\">private</span> <span class=\"token class-name\">Text</span> word <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">map</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">LongWritable</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span> value<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token class-name\">String</span> line <span class=\"token operator\">=</span> value<span class=\"token punctuation\">.</span><span class=\"token function\">toString</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token class-name\">StringTokenizer</span> tokenizer <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">StringTokenizer</span><span class=\"token punctuation\">(</span>line<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">hasMoreTokens</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tword<span class=\"token punctuation\">.</span><span class=\"token function\">set</span><span class=\"token punctuation\">(</span>tokenizer<span class=\"token punctuation\">.</span><span class=\"token function\">nextToken</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> one<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">class</span> <span class=\"token class-name\">Reduce</span> <span class=\"token keyword\">extends</span> <span class=\"token class-name\">MapReduceBase</span> <span class=\"token keyword\">implements</span> <span class=\"token class-name\">Reducer</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">void</span> <span class=\"token function\">reduce</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span> key<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Iterator</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> values<span class=\"token punctuation\">,</span> <span class=\"token class-name\">OutputCollector</span><span class=\"token generics\"><span class=\"token punctuation\">&lt;</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">,</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">></span></span> output<span class=\"token punctuation\">,</span> <span class=\"token class-name\">Reporter</span> reporter<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">IOException</span> <span class=\"token punctuation\">{</span>\n\t\t\t<span class=\"token keyword\">int</span> sum <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token keyword\">while</span> <span class=\"token punctuation\">(</span>values<span class=\"token punctuation\">.</span><span class=\"token function\">hasNext</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span> <span class=\"token punctuation\">{</span>\n\t\t\t\tsum <span class=\"token operator\">+=</span> values<span class=\"token punctuation\">.</span><span class=\"token function\">next</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span><span class=\"token function\">get</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t\t<span class=\"token punctuation\">}</span>\n\t\t\toutput<span class=\"token punctuation\">.</span><span class=\"token function\">collect</span><span class=\"token punctuation\">(</span>key<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">(</span>sum<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token punctuation\">}</span>\n\t<span class=\"token punctuation\">}</span>\n\n\t<span class=\"token keyword\">public</span> <span class=\"token keyword\">static</span> <span class=\"token keyword\">void</span> <span class=\"token function\">main</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">String</span><span class=\"token punctuation\">[</span><span class=\"token punctuation\">]</span> args<span class=\"token punctuation\">)</span> <span class=\"token keyword\">throws</span> <span class=\"token class-name\">Exception</span> <span class=\"token punctuation\">{</span>\n\t\t<span class=\"token class-name\">JobConf</span> conf <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">JobConf</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">WordCount</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setJobName</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"wordcount\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputKeyClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Text</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputValueClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">IntWritable</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setMapperClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Map</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token comment\">//conf.setCombinerClass(Reduce.class);</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setReducerClass</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">Reduce</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setInputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\tconf<span class=\"token punctuation\">.</span><span class=\"token function\">setOutputFormat</span><span class=\"token punctuation\">(</span><span class=\"token class-name\">TextOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token keyword\">class</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">FileInputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setInputPaths</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t\t<span class=\"token class-name\">FileOutputFormat</span><span class=\"token punctuation\">.</span><span class=\"token function\">setOutputPath</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">,</span> <span class=\"token keyword\">new</span> <span class=\"token class-name\">Path</span><span class=\"token punctuation\">(</span>args<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\n\t\t<span class=\"token class-name\">JobClient</span><span class=\"token punctuation\">.</span><span class=\"token function\">runJob</span><span class=\"token punctuation\">(</span>conf<span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span>\n\t<span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h2 id=\"scala-spark-word-count\" style=\"position:relative;\"><a href=\"#scala-spark-word-count\" aria-label=\"scala spark word count permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Scala Spark Word Count</h2>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">val</span> file <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> counts <span class=\"token operator\">=</span> file<span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span>line <span class=\"token keyword\">=></span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token string\">\" \"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>map<span class=\"token punctuation\">(</span>word <span class=\"token keyword\">=></span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n  <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span>_ <span class=\"token operator\">+</span> _<span class=\"token punctuation\">)</span>\ncounts<span class=\"token punctuation\">.</span>saveAsTextFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"정리하자면\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EC%9E%90%EB%A9%B4\" aria-label=\"정리하자면 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하자면,</h2>\n<ul>\n<li>파이썬과 같이 아주 간결한 문법</li>\n<li>객체지향과 함수형 프로그래밍 모두 가능</li>\n<li>자바와 호환되며 JVM 위에서 실행되기 때문에 좋은 성능</li>\n<li>정적 타입을 지향</li>\n<li>REPL Shell을 활용하여 Scripting</li>\n</ul>\n<br>","excerpt":"StackOverFlow나 Quora를 보면 Scala has taken over the Big Data world…"}}},{"id":"ce877627-5f81-552f-abd8-8b28cf8dfbaa","title":"GFS, HDFS 그리고 MapReduce","slug":"map-reduce","publishDate":"March 14, 2017","publishDateISO":"2017-03-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>데이터가 급속히 늘어나면서 기존의 방법으로 처리가 힘들어지자,\n빅데이터를 위한 대용량 분산 파일 시스템이 나타나기 시작했습니다.\n여기에서는 GFS, HDFS 그리고 Map Reduce 개념에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"gfs-google-file-system\" style=\"position:relative;\"><a href=\"#gfs-google-file-system\" aria-label=\"gfs google file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>GFS (Google File System)</h2>\n<p>Google File System은 2003년 논문을 통해 소개되었습니다.\n이전에 구글에서 사용하던 파일 시스템은 Big File 이었는데,\n구글의 데이터가 급격히 늘어남에 따라 핵심 데이터 스토리지와 구글 검색 엔진을 위해\n최적화 된 파일 시스템이 필요하게 된 것 입니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 42.24683544303797%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAARCAMAAACYVR46AAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF0UExURf////v7+/b29vT09Pr6+vf3997e3czLzNHQ0dXV1eLi4tra29bV1ePj49PU1N3d3tjX2O/v79zb2s7Pz8nJydTU1f7+/uno6NDQz8rLy/j4+NrZ2cTDw76+vs/Q0efn5+Hh4eLh4NXV1Ojo6NDP0MjIyezs7N/f38XFxdTT08jIyNPS0sXExezs7ebm5vn5+f39/fX19fHx8fLy8uXl5cvLy+7u7unp6eXk5fPz89fW1tbW1/7//+rq6rGxsdDQ0O3t7NjZ2t3c29jY2OTk5d7e3tza297d3d7d3uHh4N3d3NfY2d7e3/Dw8O/v7tnZ2dva29LT1NLR0evr7Ovq6tTV1dnY2dHQ0Nrb29fX19PT0s7Nzu3t7fz8/KCgoK2trampqaenp6SkpKipqdTT0sbHyMLCwr+/wM3MzNzd3sbFxs/Pz7++v8zMzefo6NbW1tjX19nZ2tTT1OTk5N3d3dPS0/P09Ofn5sjHxtDPz9LS0fPz9FUMn3IAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy+DuhENAAABPklEQVQYGZ3BBU/DQBgG4Pd6/dAVKLADhlPc1lvbjeLuw53h7u5/HgIjQJOFwPPgD5jCFY4PKn3h8KCk5JTUtHSflpGZpWfn5Poh8vILFEbwCBQWFZeU6u/KyjMr/EZAqayoqiZ41dQSUFff0NgEgtocZKYMhUIWwct2CAiXRVo0EGt2oUJyzl2C29rWjm9shxBHCHZIAUZEKiHc2dXd09vXjzjbIcSZxsDg0PDI6Ng4GVGYrpyYnJqemcUH2yF8oqjrKnrIIhDBy3Zobn5hcXxpalmNGkRUuNK2sBoziNbwg76+sbm1vbP5Znt3b//g8IjL45Pi07NzKbjAD/xiVMMb0i+v0q81qdz4fbd39woSEbGwYTFmikgkJhkTSIhLi1wBuNJSJBILmBBBbpomfvHweGWkPWkZz/O+F/zPK71uMO7hEcNUAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"GFS\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=316 316w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=632 632w,\nhttps://images.ctfassets.net/tushy4jlcik7/Hai8P0HMqU6dVP3JubpLr/789c917a0d3ab29d68995910c06db4cc/GFS.png?w=1264 1264w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>GFS는 크게 하나의 master node와 여러 개의 slave node로 구성되어 있습니다.\n기능으로 보면 Master, Chunk Server, Client로 이루어져 있습니다.</p>\n<ul>\n<li><strong>Master</strong>: GFS 전체를 관리하고 통제하는 중앙 서버의 역할</li>\n<li><strong>Chunk Server</strong>: 물리적인 서버, 실제 입출력을 처리</li>\n<li><strong>Client</strong>: 파일 입출력을 요청하는 클라이언트 어플리케이션</li>\n</ul>\n<p>수행과정은 다음과 같습니다.\n먼저 Client가 Master에게 파일의 읽기, 쓰기를 요청하게 되면,\nMaster는 Client와 가까운 Chunk Server의 정보를 Client에게 전달합니다.\nClient는 전달받은 Chunk Server와 직접 통신하며 IO 작업을 수행하게 됩니다.</p>\n<p>GFS의 엄청난 강점은 <strong>Failuer Tolerance</strong> 입니다.\n다시 말해서, 물리적으로 서버 중 하나가 고장이 나도 정지하지 않고 잘 돌아가도록 설계되었습니다.\n예를 들어, Chunk Server 중 하나가 고장이 나면 Master는 고장나지 않은 Chunk Server의 정보를 전달하고\nMaster Server가 고장이 나면 다른 서버가 Master를 대체하게 됩니다.\n이러한 이유로 Chunk Server는 가격이 저렴한 범용 컴퓨터들로 구성할 수 있게 되었고, 클러스터 환경에서 잘 동작할 수 있게 되었습니다.</p>\n<br>\n<h2 id=\"mapreduce\" style=\"position:relative;\"><a href=\"#mapreduce\" aria-label=\"mapreduce permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MapReduce</h2>\n<p>Map Reduce는 마찬가지로 2004년 구글의 논문(저자: 구글의 전설 제프 딘)을 통해 소개되었습니다.\n논문의 제목은 <strong>MapReduce: Simplified Data Processing on Large Clusters</strong> 입니다.\n즉, MapReduce는 말 그대로 대용량 분산 클러스터에서 데이터를 간단히 처리하는 방법입니다.</p>\n<p>그는 논문을 통해 2가지 Function을 제시하는데 바로 Map과 Reduce 입니다.\n논문에서 제시한 MapReduce의 예시 수도코드는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> String value<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> document name\n    <span class=\"token operator\">//</span> value<span class=\"token punctuation\">:</span> document contents\n    <span class=\"token keyword\">for</span> each word w <span class=\"token keyword\">in</span> value<span class=\"token punctuation\">:</span>\n        EmitIntermediate<span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token string\">\"1\"</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token builtin\">reduce</span><span class=\"token punctuation\">(</span>String key<span class=\"token punctuation\">,</span> Iterator values<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token operator\">//</span> key<span class=\"token punctuation\">:</span> a word\n    <span class=\"token operator\">//</span> values<span class=\"token punctuation\">:</span> a <span class=\"token builtin\">list</span> of counts\n    <span class=\"token builtin\">int</span> result <span class=\"token operator\">=</span> <span class=\"token number\">0</span><span class=\"token punctuation\">;</span>\n    <span class=\"token keyword\">for</span> each v <span class=\"token keyword\">in</span> values<span class=\"token punctuation\">:</span>\n        result <span class=\"token operator\">+=</span> ParseInt<span class=\"token punctuation\">(</span>v<span class=\"token punctuation\">)</span>\n    Emit<span class=\"token punctuation\">(</span>AsString<span class=\"token punctuation\">(</span>result<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 <strong>Map</strong> 함수는 어떤 key-value를 input으로 받아서 각 단어와 관련 발생 횟수를 출력합니다.\n그리고 <strong>Reduce</strong> 함수는 특정 단어에 대해 생성된 모든 카운트를 합산합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">map(k1, v1) -> list(k2, v2)\nreduce(k2, list(v2)) -> list(v2)</code></pre></div>\n<p><strong>Map</strong> 함수는 key-vale를 읽어서 필터링하거나 다른 값으로 변환시켜주며,\n<strong>Reduce</strong> 함수는 Map을 통해 출력된 리스트에\n새로운 key를 기준으로 Groupping하고 이를 Aggregation한 결과를 출력합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 73.54838709677419%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAdCAMAAADvl95BAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAGVUExURf////f39/Hx8fDw8Pz8/Pb29u/v7tXU1P7+/u3t7fT09Pn4+NHQz83NzePk5O7u7vPz8/b29/Ly8vj4+Pv7++/u7/z8++Tl5eDg4OHh4efn5/39/eXl5d/f3+vr6+rq6tra2tDQ0Obm5vr6+tvb2+Tk5Pj399PT0/Lz9Nzc3Ofn6NbW1uHh4Onp6cnJyfX19ezs7O3s7NTU1N7d3r6+vvn5+a6trbGxst3d3crKytfX17SztLi4ueLi4u3t7uLh4c7Oz728vKenp8DBwbS0tLm6uv3+/t/e3uHi49XW19bX1uvr6ubn58TDwsfHyO/v76Ojo6ysrdra2+vq6tbW1d/f4NTT1NHQ0Ojo6M7OztLS0tXV1bW1tsXFxdjY2NHR0Lm4uKKjpMHBwa2tra6trtPS0svLy9nZ2bm5udfX2NbU1crJytTU1dDPz8/P0P7//83NzuPi4dHR0uXl5tnY2OTj5PPz8tHQ0eLi4/38+9bW2OLj483Mzdzc3c/Pz+jn59HR0cvKy9TT09DR0trZ2dXU1dfY2LCnQ/kAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQNMy70vSGbAAABrUlEQVQYGb3B51fTUBgH4F/ufYM3dSSWOMLbtMXUUWsl1oYRrai4VxQXWrci4p649/i7zcUPiocm5/jB58G/M4SQhHym2bdEWchXWLps+QobechZWRRS9iOPu8pavWYtDG8AORhQJYAVsimG9MsVE4xsDMjq4DpTBoRMjBID4Np6MDIo3rBxE1L1zawYiwqkEA2XscVtbmUAihl/GbLtAlG4rbXdIs1vGxGRAjEWqg+P1AFlCRFAE6MKTEzGmGA4TtHzPBNavGNng4iwgGLT7vi77PHq7j17J0Jo8b79DUceGBKCoTkHD40ePmL7R491bADl4yMnEmjxyVODpdrk6TNnK5XWufNTF9plOwAHZSEEgKRxsVuEVh++VHOjgkySIrSBywxFke1cuSoiotK16zdCaPHNW12Gq/AnVpwIYQCQ07dbDrTm9EwTgKvwmwpIYXGmtIWE5t0xokChF6cTz1qk+W1CFhYG5vVb6OFuDdq9EKmp1v0Hsw8fAeh73GWknjx9hl+ev0Bq7uUrpF6/qU6OvYX27j20uQ8B/oOPn2bCz1++fvv+w0e2CD38BN9vOCIZhF7sAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE3v/MY0AAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"mapreduce\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=310 310w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=620 620w,\nhttps://images.ctfassets.net/tushy4jlcik7/61weYIGd3kwdwFIEpOAI4Z/eadb49a6d50d41a0c84f4b18046706ef/mapreduce.png?w=1240 1240w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>MapReduce는 여러 대의 컴퓨터에서 데이터를 처리하는 경우, 병렬처리를 하기 때문에 확장이 쉽습니다.\n스케줄러가 데이터를 분산 배치하면 worker에서 작업을 수행하고 각 중간 결과는 로컬 디스크에 저장되며,\n나중에 Reduce 연산을 할당받으면 중간 결과를 읽어와서 작업을 수행하고 마찬가지로 파일 시스템에 저장합니다.\n위의 그림과 같이 Master 노드에 모든 데이터를 받아서 처리하던 옛날 방식과 통신 처리면에서 확실히 줄어든 것을 알 수 있습니다.</p>\n<p>구글은 MapReduce를 URL 접근빈도, Web-Link Graph를 계산하는데 사용하였고,\n이를 통해 인덱싱, 정렬 등에서 엄청난 성능향상을 보여주었습니다.</p>\n<br>\n<h2 id=\"hdfs-hadoop-distributed-file-system\" style=\"position:relative;\"><a href=\"#hdfs-hadoop-distributed-file-system\" aria-label=\"hdfs hadoop distributed file system permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>HDFS (Hadoop Distributed File System)</h2>\n<p>Hadoop은 2006년 Doug Cutting과 Mike Cafarella가 개발한 분산처리 프레임워크입니다.\n이들은 구글의 GFS를 대체하기 위해 <strong>HDFS</strong> 와 <strong>MapReduce</strong> 를 구현하였습니다.</p>\n<p>GFS가 C++로 구현되었다면, Hadoop은 자바로 개발된 데다가 아파치 재단의 오픈소스로 넘어가면서 인기가 많아졌습니다.\nGFS를 구현한 결과물이기 때문에 크게 달라진 것은 없으나\n<strong>YARN, Hadoop Ecosystem</strong> 등 다른 장점으로 인해 많이 사용됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://xpgc.vicp.net/course/svt/TechDoc/storagepaper/gfs-sosp2003.pdf\">논문: The Google File System</a></li>\n<li><a href=\"https://static.googleusercontent.com/media/research.google.com/ko//archive/mapreduce-osdi04.pdf\">논문: MapReduce - Simplified Data Processing on Large Clusters</a></li>\n</ul>\n<br>","excerpt":"…"}}},{"id":"93e10410-a3f1-5148-a79f-32f260c5b90d","title":"Spark의 Shuffling 이해하기","slug":"spark-shuffling","publishDate":"August 25, 2017","publishDateISO":"2017-08-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>효율적인 Spark Application을 개발하기 위해 <strong>Shuffling</strong> 은 상당히 중요한 개념입니다.\n이에 대해 간단히 정리해보았습니다.</p>\n<br>\n<h2 id=\"spark-architecture-shuffle\" style=\"position:relative;\"><a href=\"#spark-architecture-shuffle\" aria-label=\"spark architecture shuffle permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Architecture: Shuffle</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.078167115902964%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAIAAABwJOjsAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFA0zKvPQ5YIAAAUfSURBVEjHhVZZcxNHEPY/zENeEoqiIOEpFVcIPOaB5D2pkBQkVVRIQhJiBxMCxjcGGzAWPoSwLat0WHtIq9Xe1+zszM4eSq8kCyEfbHXt9nzT09/0TE/vjLEorrec00Ux/U6n0zb891pGcYJw+F4zB9ExQtnqm/ZAphZf/zO/dWd6/UleGoBF3gTivboxQBZy3F/T65Nzmw9X94eH05DBLIeRPx+ugdndhe1hsKmhMYi42rCHZa2olARrGJF1BMQtHQ2D+7wJliNjoyh2fToCru60RxDLI2Oddx9EIskMWhaJk7Rz8gO9oh4oDgX7zqmPiUJBw/Aewd8Sx9hJCPIVAasiVsTAc2LfOuooCXFCPGy0u2YCNlVoJmFwxC6Osc0805UFqjcDrUl9NwncY4gD1wIXqFlhuoC1Bui+baTHEAcwJ2rKROGYxhNbz+aB0BG7JHDM2LdRo8x0MTDkLCrHHiX2gggkjJKmkc1dd0NogmJ4IWXJwDqKU82ladqpK34PqauZ4tPY9tnIChMWGyi0cYZzKoZRMFx1aJ+YeYa3/3zr8RxG5kZt7WX5hQs70lqVD5YjLLWqSzub97G2m21/dbOeW5aqJV4tPd5ZgXfk1oTyUqhvELuee3HX5ubThMFKuMXn+ZVlC6lPdld3hRwjhlhZosozhpVS/j9x/xH1mmPgTrp+Qfr5YuMgd33x8o3FK6XGRrB5jmxdoNI0//giv3Cmnf8OiKXfr0g/fWos37q/cePHhUtT6z8Q7jbZOu/nx83qFL/wcX3mw4i61otJMGve/GyHfw4Or82Nu+0c2f4EBDWWwBuIXX80hoU96bfL0i/jqlT89enX1+ev8EoRFy77r85SebGx+mX5wQetrW+z4zRxVbr1hbX+7/zrP24ufzX/+jZp3MP5z/29b2xu5mD2I37pfMyQ+XJK/P5Ma/LqnvDy2uw4+ETGrr95ARcuYXWDWzjLLZ7zmiu9PU794tPe0muupHstQFKqpkROmZVExLd4ihQ7/7CTZvvtYKNpVPo5ZG+nkQcKCyzjYCX2jMhuQz4jYpu+4gXZucicOAX4gi6XZ3pO+smVxlGMzEFqgGsWd7MgZWmowUhwB/tHfRXE9qShNEoT3AK+TKgHvUAJfEnXO/hNqdJJ+glFfS2J2ehxgnSHMzpo4tDDtH/sIruV0oy+17TdZjYDpEaenvG54mHxsR1fJUjpzyjy0lB/eyJCFFHvmHOc9bkarPGgyeLQwXrkKH0wjSD6mOqe3cz4kBliHWYQurVelGk3yjgiFGuwU1CShpYlgnCPr1yH3Oo7TUcBbhbRXukAPlerJUF7EL1HLNdvB3YVZgCU3RIYxLgR4ndoSJY3ndOIU0agdh6yqlD50gToeGQICcU9pm4EzHVrrltPuynTW1I4S9SuEKcGKxQzHGLjcGtViPg04hgZsNMBlyfiLggUPIgY3lC048CjUgnAQCjAqjDfSqgf46zKhmqdCAXCFyJLhmocBy6xGkngMVMCECRUOXALfk4kFhuKIMoCL3GlfYFrZLoghyxuK0ZXb5VrlTon9nQfU9Nye7pwUBY4LtNF2bI9zw8yUJQPqpV6rdLDFdU8kfjZG3l6tTQx82pqMQ/XgQcrRfhpQ3LnK9rsWnVi9tXdBcC37y0VAJcNvyxay9sNuBEAAn/7idkNwGtNW9IQKH/P5CbntqDrzqP15e1moaqfSLzPG0XOHJGAsrpkH8XhZw5Xg6M43BpMNziKcy1nmOt/Hu2MzNrIFsEAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=371 371w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=742 742w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fP7fYiSGEL6nBHzgL6ecs/8f09dc1944d8620be57f0a537329bca3/shuffle.png?w=1484 1484w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.\n테이블에 전화 통화 기록 목록이 있고 매일 발생한 통화량을 계산한다고 가정 해보겠습니다.\n“날짜”를 키로 설정하고 각 레코드에 대해 값으로 “1”을 지정한 다음, 각 키의 값을 합산하여 결과 값을 계산할 수 있을 것 입니다.</p>\n<p>만일 데이터가 여러 클러스터에 저장되어 있다면 어떻게 해야 동일한 키의 값을 합산할 수 있을까요?\n이를 위한 유일한 방법은 같은 키의 모든 값을 동일한 시스템에 두는 것입니다. 그런 다음 이 값들을 합치면 됩니다.</p>\n<br>\n<h2 id=\"narrow-and-wide-transformation\" style=\"position:relative;\"><a href=\"#narrow-and-wide-transformation\" aria-label=\"narrow and wide transformation permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Narrow and Wide Transformation</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.89111289031224%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAYAAADFTB7LAAAD6GlDQ1BpY2MAADiNjVXdb9tUFD+Jb1ykFj+gsY4OFYuvVVNbuRsarcYGSZOl6UIauc3YKqTJdW4aU9c2ttNtVZ/2Am8M+AOAsgcekHhCGgzE9rLtAbRJU0EV1SSkPXTaQGiT9oKqcK6vU7tdxriRr38553c+79E1QMdXmuOYSRlg3vJdNZ+Rj5+YljtWIQnPQSf0QKeme066XC4CLsaFR9bDXyHB3jcH2uv/c3VWqacDJJ5CbFc9fR7xaYCUqTuuDyDeRvnwKd9B3PE84h0uJohYYXiW4yzDMxwfDzhT6ihilouk17Uq4iXE/TMx+WwM8xyCtSNPLeoausx6UXbtmmHSWLpPUP/PNW82WvF68eny5iaP4ruP1V53x9QQf65ruUnELyO+5vgZJn8V8b3GXCWNeC9A8pmae6TC+ck3FutT7yDeibhq+IWpUL5ozZQmuG1yec4+qoaca7o3ij2DFxHfqtNCkecjQJVmc6xfiHvrjbHQvzDuLUzmWn4W66Ml7kdw39PGy4h7EH/o2uoEz1lYpmZe5f6FK45fDnMQ1i2zVOQ+iUS9oMZA7tenxrgtOeDjIXJbMl0zjhRC/pJjBrOIuZHzbkOthJwbmpvLcz/kPrUqoc/UrqqWZb0dRHwYjiU0oGDDDO46WLABMqiQhwy+HXBRUwMDTJRQ1FKUGImnYQ5l7XnlgMNxxJgNrNeZNUZpz+ER7oQcm3QThezH5yApkkNkmIyATN4kb5HDJIvSEXJw07Yci89i3dn08z400CvjHYPMuZ5GXxTvrHvS0K9/9PcWa/uRnGkrn3gHwMMOtJgD8fqvLv2wK/KxQi68e7Pr6hJMPKm/qdup9dQK7quptYiR+j21hr9VSGNuZpDRPD5GkIcXyyBew2V8fNBw/wN5doy3JWLNOtcTaVgn6AelhyU42x9Jld+UP5UV5QvlvHJ3W5fbdkn4VPhW+FH4Tvhe+Blk4ZJwWfhJuCJ8I1yMndXj52Pz7IN6W9UyTbteUzCljLRbeknKSi9Ir0jFyJ/ULQ1JY9Ie1OzePLd4vHgtBpzAvdXV9rE4r4JaA04FFXhBhy04s23+Q2vSS4ZIYdvUDrNZbjHEnJgV0yCLe8URcUgcZ7iVn7gHdSO457ZMnf6YCmiMFa9zIJg6NqvMeiHQeUB9etpnF+2o7Zxxjdm6L+9TlNflNH6qqFyw9MF+WTNNOVB5sks96i7Q6iCw7yC/oh+owfctsfN6JPPfBjj0F95ZNyLZdAPgaw+g+7VI1od34rOfAVw4oDfchfDOTyR+AfBq+/fxf10ZvJtuNZsP8L7q+ARg4+Nm85/lZnPjS/S/BnDJ/BdZAHF4lAq/KgAAAAlwSFlzAAAXEgAAFxIBZ5/SUgAAAAd0SU1FB+gBFA0zKvPQ5YIAAAa7SURBVFjDpVdrTFRHFF77wwRMwNa2oBCrtKIiymNZXgIKhWVR2lUehRVEFKlSjRYMYOm6ZqXlIQ8xQFAao5V2xYgCLtioIIhSKVAwVAvVJVaUVkVEQBCfp2cmc80qdy9NO8mXO3vnm2++e2bOuXdFIpFoGsIKYY54H2GKmMn60xHWrG+G+JD1p4qEmz2bNwNhqac1h+mQ37PZ+NsTaIneQ3gjfBAOrE8W8GN9J8QShCvCF+GJsJlAk8x1Z/PtEB+zvjNiKdP0YbwFPPMnMdA2hV3nIlwQi5hRa2ZKzAyRMVsWRQd231CbwqLjzHQcWfTcmLmPEIvZOBmbx4xyuhK2i681O/bULmy7/0+bwraWRHs+W9Cbadux7SVmPdhvV3a1NCQmYk9CouPFIubIttqBPakNG3dh4hYTmLRk8x3ZfMl/flypVDo7PDxc8m8QGBgonkjPzs7ONCQkxPWNeZ6GNB0cHEyF9IxqamoOj4yMAMHY2BjwNW68o6NjBOcYIyYb0JucmJgo5/iPHj3i1SPrcJyUlJRgpjm+KR3tPSoDA55XyQOhShFGJ+i3ly9f0quu8SIQzslPl8MxqW+XQUE8Msf8/TqpHkJ38cI4c8PDw3D+/HmojlBQTuUy/ydqJ0cvXrVdErFH9XIZUIQGUYN5eXkQHR1NgdsPnZ2d0N3YCByvXOZ3Q8CgEY7rOG7S+hjIzs5+DTk5OVS7IDMMinNCKLZ+7rl0QoNVzGBzczNotVqK/fv30yfuxgi+YdDo3xiU2tvBuXPnXovgjRs3wNnZGUJVlbDsq5MUkvBd/AbXzJ1jcTY7q76n7hzcutAAo6OjvGfm/u3bQDjNGs3YEV+fTwQMGn8XFfk14RLU4ENGRETQhyatp6cH1Go1bNmyBTTaC1DXdhPWKA/unu+73tJQkhgfOnToi9bW1jKC+vr6cq6vD+5+RUXFj1ykDOlt3rzZXn8eZupvcrm8pqCg4I5MJruISXnKz8+vDSNLOfHx8WIBPZGRUql0PXDgQAQBno+1XF8fubm50eSakZERxhkxpIclZrq+XnBwcNGsWbO2WllZ3Y2MjIy2t7ffl5ycvI3jhIWFWRjUsxGbm56urTg6MHQXHg73jctirg0NPQTCae/4ZTQ+c8l0IYPq9AQF4RIMDg7AtWvXwMfHB54+fQoqlQr27t1LzzVZj3C+yUqMthGb8X+AxO1c7FGgDQWCopNR4ww+efKEXn/vvgQcb0/ZSsEsxnEdx9We+QHS09MhPz8fysrKQKFQgJubG/j7+0NhReQrzU27PPiTZIPS3XPP8SAgyD8RQZMkKSkJ3N3dKaytraG9vR2uXP8ZOF7WEblQFhvvPiLXcVw7J2vIzMwEPOcQFBQEGo0GozoItra2cDR6JRxbJaPY6SNZwqu2UbXYs7AqFAiKtFHU4G3M2K6uLgpSIp49ewZXdZeA4+UdDxI0iMZ0HPegJg/wnNFdIAb7+/tpv7u7G1I2poJyQxqFYtlafoMeAVbTtGdLKnv7rsHf97sNnsGBh/eBcJraah/vKJLaCm3xrtxNsYRL8GCgDxoaGiAhIQHKy8uhqKiIvC5pHfzj5j1EH8Qp87d+IF7+rsEsLiwsDK6trU0jwDKSxfX1wd0vKSlRT5TFsbGx1vrzsKykL1y4sBFrX6u3t3erRCL5vrS09NU6cXFx8wT0REb4chcTkwSpqamruL4+8KAryBWLrHwigytWrDDT1xOLxaqYmBilmZmZxtzcvAm/XjI4PQJs5gb1plrMM6k+U695MDiCKT9q8E0yODQMhPPr5Sujrqt3TxM6g4k70kMIl6Dvfj+gSUhLS4O2tjbAiNGSQ8sMrkc429XZEe/MtDXhVXP6bKfn8hQtEITs1FKD5AuGQ29vLzV4sV0HHE+WdFwwSXBcx3EjNyYCRo8mHDmL+/bto6XGxsYGglUVrzSdFan8SeIUqvIISC4HguAd5TRJoqKiALeCwsTEBFpaWqARDXI86bajQnXQGMd1hCdLPgGuS2U0gsXFxdDU1IQFf4gWbC8vL4jPWQXqw+sp1mwP4K+DkjC1R6DyFBCEqqupwRcvXsDz588p7t27RyPYeLkbOB4uLliocVzHcRvarvMeGVJ69mySQqlKTrFd4cpv0HKRr3lhifanlqt/QlvnTYNfwH/d6YPWqzeh/HTjY5dV3y4WiuCa+IwvW5BLNMk8vkbWuYUvgJ7WFshaHZkitbSYYSiLJ+FXRjgW5FwC/PrIxa/dcairq6PjWGYycM5bQv8h1q1bN59wMSHoPD49sg63JpalBfr/g/XbPwnGCItCwqdgAAAAPXRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCAyMDA3IEFwcGxlIEluYy4sIGFsbCByaWdodHMgcmVzZXJ2ZWQunmbcKQAAACN0RVh0aWNjOmRlc2NyaXB0aW9uAEdlbmVyaWMgUkdCIFByb2ZpbGUapziOAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"narrow and wide\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=312 312w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3MR55280VY3jq97WtgvlqZ/ccfe293913bd8be4c76d3bca47b8e315/narrow_and_wide.png?w=1249 1249w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>몇 가지 사례를 통해 더 자세히 알아보겠습니다.\n만일 데이터가 이미 키 값으로 파티셔닝 되어 있고 키 값에 대해 변화를 주고 싶다면, 좌측의 그림처럼 수행하게 됩니다.\n<code class=\"language-text\">filter(), sample(), map(), flatMap()</code> 등의 transformation이 이에 해당하며, 이 경우 Shuffle이 필요 없습니다.\n이를 <strong>Narrow Transformation</strong> 이라고 합니다.</p>\n<p>반면, 서로 다른 파티션으로부터 특정한 값을 기준으로 추출하고 싶은 경우, 그 값을 기준으로 Shuffle이 발생하게 됩니다.\n<code class=\"language-text\">groupByKey(), reduceByKey()</code> 등이 이에 해당하며, 이를 <strong>Wide Transformation</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"shuffled-hashjoin\" style=\"position:relative;\"><a href=\"#shuffled-hashjoin\" aria-label=\"shuffled hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Shuffled HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXVJREFUSMe1l21MW1UYxztg0/gSDcRP6jRBZOCcMU4/mJiYmChu4JhhW11wQgJb4pxOfAHdhjLYYO4FVhgDCgxJ5rLWQYHSwcpagcteoGPQAqUtjJeSeJH2toWuHbDyeM5pe+naLoOiJ/n1nPvc5/7z7zn3Pudejkwmu08pBh3ULc0iCswSYgitbsixevXqcI5Xi4iIiFJrdD75/jT8xa7dGnQgbzbOgFrjOCAwwkEhA3kNZtIfEBjg54sGMj4psXjEpsg4t96Zh6ENZlizZo2Pwejo6KjxKTub59b+6cKkTyzDTyyndgp0Op2dox7UOJILlZBcpIL9lQOkT+L1QlJhrzNW4Rv7it9Pesz1zm4IDg5+25/BEXqGzXNrf3H69pJiX/P7nAaHhoYcqMFSsU8bwTqlZ1m4P48Nvo88RXobBNSWo20zTbK6d6cmFg3CMprlch4YizaB8Uws2ErjYJoecS/xM4i3EEGeBpfTTBf2gpH3EdFnij8JzKBRkgc0Lxbooi1gKo6Fm7JGPIPvuCYuGLER8XQgBqf+2Ad0QQzQhXFAF3/qNCiRSCiVStWxVJS9PR29PbdZVCplh8vg6x4rHBUWFvbucnS9tZUI5E3O+Q/b467Ze8p1/AJi3YpVy8vLvxOLxd+vhJCQkGc9JLGpl9auXRtWVVWVnZaWdlwkEgWky+fz93M0Gq2jtusuiBQ2Fnxc4xUTKXDM6hWzge3evL86+FxoaOg2g2UWajqtcLyagovt/5D8S50zPhr+YuJuq/MexIV6N38M9pTr4XANTfrd/FFwx3LrJl2xMRLH40OCv0mPoW4oAM1gtJ+dJLpBSkEyr4/k7S9qh10nFZBaOsJe69ZOLb3jE0urHnMa1Gi1DiE1BsL2RQTto4RHxTD2WVIHP0Se3kA86VkHmZl7UFnbAblVMpJbLe6CoxVXfDQEbSM+sfob+sDKzIyyCYzNpwjTLfkwO2N0L/EqxCtuo55lxmw2g0KhgLm5ObBYLNDV1UUKs3czXz/PajPSggALddMxMPG3galiJ9jPbQdFWzNe4jc9VhcbjUD34Far1cpet7CwAD09PUDTNDGHTWKzDxj88wdgzm4h2qaqXQHOYH8LMFfPEKblxWgGGbzE7yFTGxDrXeWGExUVFa3VaokpT6Pj4+PQ19dHxmq1GiYmJhb/fKeA1WZkZ50GMzMzt/B4vPiVgAy67z28zUVgs2jZN+bn529FxCckJHATExMzs7KyduL89PT0eC6Xm46PU1JStiUlJWX400Xe4jj/Y3vMNaMbXEV7lcs8vkefcD9LiBfx1ugq8sE+Kmg7aUfbDLUS0Avr89664eHhL7vPt7W19dfV1fWUlJRQLS0tHU1NTRo0sxTqqdbW1v6ysjIK3QrX0HmlUChkdRsbG2XkfTBHZIKjdWb4TWwhfU4tA9kIPMYvrLg/gnKya4xkfKLRGcOYpu34KX7V9e9ZIiMj1/cN0WwevuYI6tNKe2FfAQV7T/0F2QI9OfeLgIYvT8rh0PlRyKszOPPFxsVCzeVp4TOeDr75fYT03NMaAh5/Wz3qE9tTfof0mM5upbsOrvMEvSxsrm2+xua5r9lRoGb1th+WwscZYog92IxiWth08Ap8fqyVnE8t1ToNoh/HxKQJPNG7eFQMg0vGw1755+bv++TracYnNqqnQd5+AyTSVqiXSKGmoRnUQ2OBlRmmpRDoswkIVAvLd4DNMPFQg8vRnZ2dBYPwR+j89QPQndgMwwXxKyjUZdgcF+yVCdBNSSEoKCgGeXrNE7TEcbjeLRX0sIC+cjcwhTHAlGwlmwExKJfLHcPDw7BU+m/KoffqJYJSVgPawQF42GfncnQxKuryA9ros9P+L241uownC7ixAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"shuffle join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/5UW8BXEFxUTnUiCTERknJh/79783cc53e1824dae0f3ead7e85cb08d/shuffle_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>두 개의 테이블을 <code class=\"language-text\">Join</code> 할 때에도 Shuffle 이 발생할 수 있습니다.\n위의 예시 처럼 두 테이블에서 키 값을 기준으로 Join 하게 되면, 동일한 키를 가진 데이터가 동일한 파티션으로 이동합니다.</p>\n<p>하지만 이 때, 셔플 되는 데이터의 양이 성능에 영향을 미칠 수 있습니다.\n만일 C의 데이터의 크기가 A보다 훨씬 크다면, C에 대한 작업으로 인해 전체의 수행시간이 오래 걸리게 될 것 입니다.</p>\n<br>\n<h2 id=\"broadcast-hashjoin\" style=\"position:relative;\"><a href=\"#broadcast-hashjoin\" aria-label=\"broadcast hashjoin permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Broadcast HashJoin</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.83061889250815%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAYAAACIhL/AAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUDTMq89DlggAABXRJREFUSMetl2tMk1cYx4uA4cO2BBwDdyVjmIjZls1tH5bFD2bzghRkoKCZmX5As+zmLskYIsu8uyiD1lah1WUsZg4DLVIYuFISLmabYKGA0AtS5GIrtm9rkaJSnj3ntO/blxYnFk/y4xz+Oc8//7Tved5TgUajmW5t7/e0duj9tBPmoSEGo8kTGRmZKAgYSUlJy/v0xqD9c3nMpV3q6PdgtknB1T69Z0+FDQrO2+FIjYPOeypuQf4ft+j6eJ2Tp43T9eEL3n0Ex8RdWLx4cVDA5OTk5dfH3dw+1vv7362cxnrn8TTW+4BiHIxGo1vQ16/37BDrYMeJbth95iqdt4u6YLu4y6udDtY+k/XSmeCcmHpgwEGLi9vHen9covVrp4M11vsLWY83oMlk8uCA+eK+bYOJ8WGOmen7DwwIOPy107PqHgap4QLCIwznn0fAdiIFbJJUmCwVQv+VNggPD1+FmV7iExcX977ZbAaWzo7L4JBgnWiNF/SwS4TglqVTL5toLdXtqDOSDeC5fy+0gLa6I2ARpYLlRDow0lQ4VXSIBHwPQz3BJyEhYaXL5QLCyMgI/FC4F8ZEQrhRvI5iEQuph6M0g66pXvQBWEpSwCpK8Qesq6tr7e7ubpsvuq7Otq5OLUdDfX1bWFhYGoZ6hf8VJyYmJpD9arW6VyqVdioUiks6Xt3/QfaRWszWJHhM4zXkaeRNJIynv4rEIW+E7CyXy79RqVTfLoSIiIgYtHodCUfeQmKjoqLWnjt3rqCwsPAQzntD8ZXJZLsFer3Bo7h8B5Ttkxzk/6oATdlOtIkAbRImp7hT/DwJhjyDpC9dunTN2E0GJFXds/ZX/usK8phLU12Z8D6DpFHvlA3BLvkw7Kuy0HmnzAysdrja6tOGqE7Weytu0JngmN0H032nWBAfH/9u0clybh/rnVs6yGmsd27pNU5jvb8uH/IG1BsMnvOtQ3C+xU9Fi5nyMI0wdZd+gkmYaaXveUsmAZcsWbLKMGCGg2U1cLbR6PdpHgzymEu78PdwaG3GpasHW0MR5bb6ZxgfHYRFixZt9D1/9ACTAxMbG5tF9s/MzIBWq4Wx0RFgLhZxtQS7z4OvUR33zWBjD61R1x8FRrYJmNNbwf3LZpAeP0gCrsdQK3h8FxMTk9bT0wMsn36yCxzybLBLhUga2GWbgTmzFaZ+2waMPMerkSZdmgmOsszQG7WrVw32RgnldpMUrMPXSMA0Xnt5llxm8E2SytbodDoYuT4EjEbC1fI9AjWyj/sEsQ2ki0SijQsB3yRP+drLk752I8Dn8p2CgoJt2dnZefn5+SH5Yjah4DGPDOQF35o07i0BjfvRB75OWvC10roQ8ML6HDm4yIu+frg6Ojp6dXNzs1apVIbsW1tbq6H3wQNKBg5VO+AnlZPOBxR22I+QNblUkvkg7tlfZaPrY7VejeC8w11Y2dcZ+YpfxkOy+frNO/B5cSutZb33Vd7ialnvH3ka631MZfM36hyRAbaIjPDlr4N0zinRU8j6q3JzkLZLfo3OBMY1RW4zGzBUNPI2efxIymXLliVXN7RA1tEOWJ9Xw3lnF/dxtaw3X2O9c0sN3oD4xzNiZYDPsI+HaQSn00lOcabvYhDGv7Deuz8NLZcug7L2Imh7jV4fiz3IYy5tbNwRWpuxq8VgOZmFYC/EvnZWJmbvg3PeqMkYHR0FcUkxWGkdIXOWB5ktUr9mPbVpgY26bBNtru4zWdD2l4p8gusCGvUKfNUJ+Y26plqBjRqbM23UCPXYAlPlH9GQVBOvB/upDLzEfugP2NTU5BkYGID50vtPE3Q1VlJ0miow9F+FB/3s5NeZjEbcX8nV8j0CtS7cN2AyAf7sdP8Hyn6MCRFbKX8AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"broadcast join\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=307 307w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=614 614w,\nhttps://images.ctfassets.net/tushy4jlcik7/2uLtkdnwuEke0F2ULvRfDD/48413f8752d889d652ee925b9c946745/broadcast_join.png?w=1228 1228w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 개선하기 위해 Spark에서는 <strong>Broadcast Join</strong> 을 제공합니다.\n이 경우 RDD 중 하나가 모든 파티션으로 브로드 캐스팅되며 복사됩니다.\n만일 RDD 중 하나가 다른 것에 비해 상당히 작다면 큰 RDD가 전혀 셔플 할 필요가 없습니다.\n작은 RDD 만 모든 작업자 서버에 복사해야 하므로 Broadcast Join은 전체적으로 네트워크 트래픽을 줄여주는 효과가 있습니다.</p>\n<p>Spark 1.2에서는 <code class=\"language-text\">spark.sql.autoBroadcastJoinThreshold</code> 값을 설정해주어야 했지만,\n2.0 이후 버전의 경우 Spark SQL이 알아서 최적화 잘 해줍니다.</p>\n<br>\n<h2 id=\"spark-shuffle-properties\" style=\"position:relative;\"><a href=\"#spark-shuffle-properties\" aria-label=\"spark shuffle properties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Shuffle Properties</h2>\n<ul>\n<li><code class=\"language-text\">spark.shuffle.compress</code>: 엔진이 shuffle 출력을 압축할지 여부를 지정</li>\n<li><code class=\"language-text\">spark.shuffle.spill.compress</code>: 중간 shuffle spill 파일을 압축할지 여부를 지정</li>\n</ul>\n<p>Shuffle에는 위의 두 가지 중요한 Spark Property 가 있습니다.</p>\n<p>둘 다 기본적으로 값이 “true”이며, <code class=\"language-text\">spark.io.compression.codec</code> 압축 코덱을 기본으로합니다.\n그리고 위에서 설명한 것처럼 Spark에는 여러 가지 셔플 구현이 있습니다.\n특정 구현에서 사용되는 Shuffle은 <code class=\"language-text\">spark.shuffle.manager</code> 값에 의해 결정됩니다.\n가능한 옵션은 <strong>hash, sort, tungsten-sort</strong> 이며, “sort” 옵션은 기본적으로 Spark 1.2.0부터 시작합니다.</p>\n<p>이외에도 Spark Shuffle 관련된 Property는 아래의 공식문서에서 확인하실 수 있습니다.\n<a href=\"https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior\">https://spark.apache.org/docs/latest/configuration.html#shuffle-behavior</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://0x0fff.com/spark-architecture-shuffle\">https://0x0fff.com/spark-architecture-shuffle</a></li>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"효율적인 Spark Application을 개발하기 위해 Shuffling…"}}},{"id":"d6b966db-7d90-5cd5-82f1-367e7df7e58a","title":"Serverless ETL 서비스들에 대한 리뷰","slug":"serverless-etl","publishDate":"August 23, 2019","publishDateISO":"2019-08-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL에 관련되어 있는 서비스들을 사용해보면서 느낀 점에 대해 정리해보려 한다.</p>\n<br>\n<h1 id=\"lambda와-athena를-활용한-쿼리\" style=\"position:relative;\"><a href=\"#lambda%EC%99%80-athena%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%9C-%EC%BF%BC%EB%A6%AC\" aria-label=\"lambda와 athena를 활용한 쿼리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Lambda와 Athena를 활용한 쿼리</h1>\n<p>Athena는 Presto를 기반으로 만든 대화형 쿼리 서비스이다.\n쿼리 당 스캔한 데이터의 TB당 5 USD 만 내면 된다.\n보통 분석용 쿼리를 위한 클러스터는 리소스 요청이 불규칙적인 경우가 많다.\n운영을 위한 비용까지 고려한다면 정말 좋은 서비스라고 볼 수 있다.\n하지만 모든 서비스가 그렇듯 장점만 있는 것은 아니다.\n특히 Athena를 분석용 쿼리가 아닌 다른 용도로 사용한다면 몇 가지 제한사항을 마주칠 수도 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.625%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACiFBMVEX////j4+L19fT89/XuzLX//fzw287++fXw6t/aw5P48uTn7d6yxpbx3M/yxqj//fvOkm3hhkf/+/n8+vnFeUn4z7P//fn//PX//PTn3cjHpF3n1bHk5uPIzMLqs47Ozc29vb2+vr7x8fHRh1nPfkr+8ejg2tfi1Mv17Of67uXSuKfv5+Hg4N/o5d7ItY/p5dzm5ubHx8fQ0NDR0dH7+/v++/j++fbmy7nmso///Pno6ejYs57zwZ/h4eH5+fnU4MTJ1bjLy8vT09P//fX//PP+/v7p6enq6ury8vL//vv99Oj9/PX19/PU1NS8vLz8/Pza1tTf2NP9/f3T2Mzc4Nb//ff/+/P56uDq39jc3Nzk5OTl5eXQ3+6hv93//fj+9/P++ffW1tbGxsbk4tv69Ofjv3T05sr+9en45djw8PDo6Oj//v3+9+3v7+/MzMzIyMjs7Oz98+3+9/Le3t759+/rtZC7u7v59Orfv37z6dP56+Hx5t/f39/++vDb5/OzzOX+/f39/fz98u3+9vL9/v2kvoHS3sD++vf9+fb08/O6urrKysr++vL45df67eXd3d398+b6+vrY2dvIz9b++vHxyKz15Nje2dbk39zx7On85tr+//63yZ/f5tXi4uLj4+P09PTt7e356+L8+PXg4OD98ev7+fLNzc2/v7/n5d399Of01cD039H8+/r++O3228j68On+9vHOzs7i39j8+fbg3t3BwcH//fb///7//Pr+8evPz8/28+z++e///vrd3Nr/+/LAwMDd29nz8/P78+799O6ctc1wmsLy9vqmt4/C06lagacwbabd6PJ9k1+TsWv6+/fI09+sxNv7/PzU2M7S28XFxcW2traUR+PYAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUWUOwe9QAAAcxJREFUGBmFwXd3SwEcgOHXiD1b8rt2U7MUSRvXjFFSsw2hSGOv0kqV2JvgoiVKraJRYs/W3nvv/XXc3PQcx+kfeR6qq1GT/9SqbaJOXf6pV78BuoaNqNK4SVN0zZrHxbdoiVlEFCJatW6Drm27+PYdEiyJ0LFTZ3RdunZL6t4DgWQhomev3oDVlpJqp49qgr79+qOzDhg4yDEYYchQIcIxLG24MsKZPnIUMHrM2HEZmS4M4ye4QZg4STBkAZOZMtWT7UWYNp0ZRM2cBcjsOalzMci8+Qty1IVJi3Lz1MW+/CUFQtTSZYAkJvuXu1fkr8xFWbV6jbB23Xq/lw1s3ISwmS12J1sDgGzbvkO0nVbPLjUndXdhkbpnb3rQre0r3n/AV6IdPHT4yFGtNADIseMnBIOU2UJClJwMhcqFU6fDZdmcCQBnz1nOX8Ag+JwXtUuXUzLSrlwFF0XatetBfzivtAKQwsrKGxgEULh5y2K5Hb5zFxclqqreA+5XAFL+wPsQg1lEzFRRlEfKYwg+cYIaB2SJyFOqcXlsz8I+7J7nL4jB+RKd6RWxvH7zFnj3nlg+fPwEfP7ylRi+ff8B/PxFDMW/Mx1QkPDHh+EvsS170itX3tcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"serverless-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=200 200w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=400 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/2B9Pw4oB79c8tTZHyqHm2K/fcbf844be91197f42d870212872ae6a7/serverless-etl.png?w=800 800w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Athena를 ETL 용도로 사용하고 싶다면 위 그림과 같이 Lambda, CloudWatch를 통해 트리거할 수 있다.\nAthena 뿐만 아니라 Glue, EMR 등 다른 서비스도 모두 Lambda를 통해 실행할 수 있기 때문에\n정말 온디멘드로 띄워놓는 인스턴스 하나도 없이 ETL을 구성할 수도 있다.\n하지만 정말 데이터가 많고 복잡한 작업이라면 아래와 같은 제약사항들을 잘 이해하고 선택해야 한다.</p>\n<br>\n<h2 id=\"구글의-빅쿼리와-달리-쿼리-비용을-추정하는-기능이-없다\" style=\"position:relative;\"><a href=\"#%EA%B5%AC%EA%B8%80%EC%9D%98-%EB%B9%85%EC%BF%BC%EB%A6%AC%EC%99%80-%EB%8B%AC%EB%A6%AC-%EC%BF%BC%EB%A6%AC-%EB%B9%84%EC%9A%A9%EC%9D%84-%EC%B6%94%EC%A0%95%ED%95%98%EB%8A%94-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%97%86%EB%8B%A4\" aria-label=\"구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>구글의 빅쿼리와 달리 쿼리 비용을 추정하는 기능이 없다</h2>\n<p>Athena는 쿼리 비용을 추정하는 기능이 없기 때문에 잘 모르고 쿼리를 막 날린다면 과금 폭탄을 맞이할 수 있다.\n물론 처음 사용하는 경우, AWS에 실수한 상황을 설명하면 어느정도 과금을 물러주기도 한다.</p>\n<br>\n<h2 id=\"athena에는-동시-쿼리-제한과-시간-제한이-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%97%90%EB%8A%94-%EB%8F%99%EC%8B%9C-%EC%BF%BC%EB%A6%AC-%EC%A0%9C%ED%95%9C%EA%B3%BC-%EC%8B%9C%EA%B0%84-%EC%A0%9C%ED%95%9C%EC%9D%B4-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena에는 동시 쿼리 제한과 시간 제한이 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena에는 동시 쿼리 제한과 시간 제한이 존재한다</h2>\n<p>Athena의 기본 계정 당 쿼리 한도는 20개이다. Support에 요청하면 늘려주기도 하지만 이 역시 제한이 있다. 또한 30분이라는 쿼리 제한 시간이 존재한다.\n따라서 오래걸리거나 무거운 작업에 Athena 쿼리를 활용하는 경우, 앞단에 큐를 두는 경우가 많다.</p>\n<br>\n<h2 id=\"athena는-udf를-지원하지-않는다\" style=\"position:relative;\"><a href=\"#athena%EB%8A%94-udf%EB%A5%BC-%EC%A7%80%EC%9B%90%ED%95%98%EC%A7%80-%EC%95%8A%EB%8A%94%EB%8B%A4\" aria-label=\"athena는 udf를 지원하지 않는다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena는 UDF를 지원하지 않는다</h2>\n<p>어쩌면 크게 다가올 수 있는 제한사항 중에 하나이다.\nUDF를 많이 등록하고 사용했다면 사용자 입장에서 불편할 수 있다.</p>\n<br>\n<h2 id=\"athena의-ctas-쿼리에는-파티션-한도가-존재한다\" style=\"position:relative;\"><a href=\"#athena%EC%9D%98-ctas-%EC%BF%BC%EB%A6%AC%EC%97%90%EB%8A%94-%ED%8C%8C%ED%8B%B0%EC%85%98-%ED%95%9C%EB%8F%84%EA%B0%80-%EC%A1%B4%EC%9E%AC%ED%95%9C%EB%8B%A4\" aria-label=\"athena의 ctas 쿼리에는 파티션 한도가 존재한다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Athena의 CTAS 쿼리에는 파티션 한도가 존재한다</h2>\n<p>CTAS 쿼리란 SELECT의 결과로 채워지는 새 테이블을 생성하는 쿼리를 말한다.\nCTAS 쿼리를 사용하는 경우, WITH 절의 external_location을 통해 저장될 위치를 지정한다.\n이 때 Athena가 생성하는 쿼리 결과 파티션이 100개를 넘어가는 경우 오류가 발생한다.</p>\n<br>\n<h1 id=\"glue-etl-data-catalog\" style=\"position:relative;\"><a href=\"#glue-etl-data-catalog\" aria-label=\"glue etl data catalog permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL, Data Catalog</h1>\n<p>Glue와 S3 Batch는 Athena와 달리 태생부터 ETL을 위해 만들어진 서버리스 서비스이다.\n특히 Hive Metastore를 대체할 수 있는 Glue Data Catalog와\n자동으로 스키마를 생성해주는 Glue Crawler는 정말 편하게 사용할 수 있다.\nGlue Data Catalog를 사용한다면 Athena, EMR 내에서 Glue를 중심으로 데이터 소스를 통합할 수 있다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.63136661623802%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAABAhJREFUSMetVVtPG0cU9g9rJaogNbQRjcgL/IsKBXF5AV4QT436FyJ6U9Omr31NoggoLk3BeG3vfWfvuzN7v9nG/extHkpslII/jcdnLrvfOd85M9tY/vzTJ198srq69vjxVw+XltbW1lZXV1dWVh4sPlhcXFz4bOEubWHh4X+BVy0vLy8tLcF+9OhLbGhQSm3bdhwXvUsDmZVGXKEnYcX7hRZWXa9AI1EVx/FoBqIoohMEQaA4DI/LQakGJR4UaaEEpcRKGJiH0Wq1dF1vOEGSZfmHsCyL6+itFhFFUZZlVTU1Mn7v/eHRQHKChp1ULcVXrCCKkzhO6j5OEp9SVQsF3pJESZIUSRpxHM+123BodD8Mr0fF4LrhhcnLE/WkY3Ec12w2Ly4vwANVQWxaIdF8yEIItawqiuBTPBwOR/NAIy9KKF0U5Y0GYkVTddvUDNKTBcdzwzCEEl7kBnEwB2L8+v3+hwuu5xFd1zSNEIIcU8qQ+NH8MCb+zpBfU8f1XMD3fc/zsiyD3e12QXl21vyr9a4rdBVZGQwG8yRuhr6apzcjdr3Tjvr8rfL9iXl0TM6UpGOFgpvzTip6Zc9ORLeADYN3snoGrRr8H+KqqqZKfXolH71Wfjq2Xl3a5wJrq6ytsC6JOC3ktKAl+1eyD1faJutaMWZ6Zto2g44V9YykrdAOiQQ7vzIpNoTZYArxW+YK6bhcr98Dk47r8KrEaYJkaW2VJ55VVGVeFUmewUCLsqSsSgzR8qqM8zQr8n+HZZGVOWZgxFmKneNnywJGPLGxc0z8wlKPmVdnlzGGM56mKVIuKjKviJqpK7omKKJq6D5lSZLghkKFo4eNCschyEGTxWmRJmnC0gDDNE9pwmBgQ70UpmGCXWXOYhan8Zh4MJySGRSXRFTBUHTf1lxTdQz4/t7rsZHkKdxHfHcvrqm1CuKeJHBSD4KLRO3JIrEMy3FxLUMShAsD90mURWhZnrEJoAGCYwlEC24/AmPib+XO767pTkAZhea11IpBVEe3mIuIkWMEF6YRMoeg53OcpDR2y+LGAqW+Ssjpn2fN83NRVTp876T5x/nfFz2eR8TOBHARVzf6MAptarvM9ZhXfhxm3lxplpVVdfTDjy9e/lZ/72D8/Muvr968wfz925i45C77po70ZBNA5/Ffng8nGAxvw+Cjl3AQoA0CQHFgOLlAJL5SBIRff4mLokAPP2pNsE8QRd0wpiqGbybUnro0rhXINg1Vv9+YlXwQ15cJ/EDRXc/ALUu3YyYxBK93oAKg0qzn8fWcMzGyXO/ATV6f0TkT7+/vHxwcHB4e7u3vf/Ps2cbTp1/fCevr61tbW5ubm+i3t7dre2dnpx5ubGzs7u7u7e1hiB7DfwCtd8Pd9KKYPAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"glue-etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/7lkQZ9eTl9QHjcwlT6l1u2/1efd891f670c6f26a1627bbc8d1e4a80/glue-etl.png?w=1983 1983w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>하지만 Glue ETL와 S3 Batch 서비스는 요금에 비해 활용도가 낮다고 생각한다.\n먼저 Glue ETL은 위 그림과 같이 input과 output을 정의하고 그 사이에 transform 작업을 정의할 수 있다.\nSpark의 DataFrame을 기반으로 하며 DynamicFrame, Built-In Transform 등을 사용하여 스크립트를 작성한다.\n서비스 중간에 추가되는 간단한 ETL Batch에 사용하기는 무난해보이지만 그게 아니라면 아래와 같은 사항들을 고려해야 한다.</p>\n<br>\n<h2 id=\"glue-etl은-dpu를-기준으로-요금이-계산된다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-dpu%EB%A5%BC-%EA%B8%B0%EC%A4%80%EC%9C%BC%EB%A1%9C-%EC%9A%94%EA%B8%88%EC%9D%B4-%EA%B3%84%EC%82%B0%EB%90%9C%EB%8B%A4\" aria-label=\"glue etl은 dpu를 기준으로 요금이 계산된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 DPU를 기준으로 요금이 계산된다</h2>\n<p>Glue ETL의 요금은 DPU라는 하나의 처리 단위를 기준으로 산정되는데 1 DPU는 4CPU와 16GB의 메모리를 가진다.\nDPU 시간당 0.44 USD, 초 단위로 청구되며 Apache Spark 유형 ETL 작업당 최소 시간은 10분이다.\nSpark 기반의 ETL에서는 Executor에 대한 설정이 중요하다.\n작업에 따라 CPU가 많이 필요할 수도 있고 메모리가 많이 필요할 수도 있다.\n하지만 Glue는 DPU라는 단위로 고정되어 있다보니 비용 효율적으로 사용하기 어려웠다.\n만일 자체 클러스터를 사용하고 전체 파이프라인 내에서 리소스를 효율적으로 사용할 수 있다면\nGlueContext가 뜨는 시간까지 고려했을때 정말 저렴한 서비스인지 잘 모르겠다.</p>\n<br>\n<h2 id=\"glue-etl은-디버깅-모니터링-기능이-아직-부족하다\" style=\"position:relative;\"><a href=\"#glue-etl%EC%9D%80-%EB%94%94%EB%B2%84%EA%B9%85-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%EA%B8%B0%EB%8A%A5%EC%9D%B4-%EC%95%84%EC%A7%81-%EB%B6%80%EC%A1%B1%ED%95%98%EB%8B%A4\" aria-label=\"glue etl은 디버깅 모니터링 기능이 아직 부족하다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Glue ETL은 디버깅, 모니터링 기능이 아직 부족하다</h2>\n<p>Spark에는 Spark UI 라는 휼륭한 모니터링 대시보드가 존재하지만 Glue에서는 아직 이를 지원하지 않는다.\n대신 자체적으로 CloudWatch를 통해 메모리, 로그를 제공하는데 아직 지표가 많이 부족해보였다.\nDAG가 어떻게 구성되는지와 Shuffle 관련 지표도 볼 수가 없어 무거운 작업이라면 많은 노력이 필요하다. 아직 오픈한지 얼마 지나지 않은 서비스라 이 부분은 앞으로 많이 개선될거라 생각한다.</p>\n<br>\n<h1 id=\"step-function을-사용한-etl-workflow-관리\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-etl-workflow-%EA%B4%80%EB%A6%AC\" aria-label=\"step function을 사용한 etl workflow 관리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function을 사용한 ETL Workflow 관리</h1>\n<p>Step Function은 Serverless 기반의 Workflow 서비스다.\n여기에서는 가장 많이 사용하는 Airflow와 비교해가며 Serverless ETL이 가지는 특징을 설명해보려 한다.</p>\n<br>\n<h2 id=\"step-function은-asl이라는-언어로-정의된다\" style=\"position:relative;\"><a href=\"#step-function%EC%9D%80-asl%EC%9D%B4%EB%9D%BC%EB%8A%94-%EC%96%B8%EC%96%B4%EB%A1%9C-%EC%A0%95%EC%9D%98%EB%90%9C%EB%8B%A4\" aria-label=\"step function은 asl이라는 언어로 정의된다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function은 ASL이라는 언어로 정의된다</h2>\n<p>Step Function에 들어가는 각 단계에는 Lambda, Fargate 등의 서버리스 서비스가 들어갈 수 있다.\n그리고 각 단계는 Amazon States Language 라는 json 기반의 구조화된 언어로 정의된다.\nAirflow가 많이 사용되는 이유 중에 하나가 파이썬으로 DAG를 구성할 수 있다는 점인데\n이에 비해 json 기반의 Step Function은 너무 복잡하게 느껴졌다.</p>\n<br>\n<h2 id=\"step-function에는-operator-sensor가-없다\" style=\"position:relative;\"><a href=\"#step-function%EC%97%90%EB%8A%94-operator-sensor%EA%B0%80-%EC%97%86%EB%8B%A4\" aria-label=\"step function에는 operator sensor가 없다 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Step Function에는 Operator, Sensor가 없다</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 349px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 130.65902578796562%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAA0CAMAAADPNIq/AAACwVBMVEX////59er03qTz2I3z3qL48+f59/D52YD/2nX62H749ezz47j30nDlxWv92HT81nL51nTz4rH04KrzzWyqkk+pkU7FpVbbwWrz3qTz6czz58X+/v3+2nX03Z79/fz07t7o3Ln07dv+/v7Nzc35+fn39/f29vb4+Pjp6en9/Pv6/P3///76+vv08/P//v77+fj7/P62r6mgoKDAwsLN0dfGwLumqaq0tLLLzc/V1dW0raiurayvr6+qrrKpqar18eyfnpyusbOoq629vr7+///w7u329/j49/bk5OTz9fbr6unm5+j39/by8vL9/f3u7u78/Pzs7OzR0dH6+vrp6er//vynpKKjqKupqaf6+/enpqetq6rP09bGxcSwramrrK+vsbGurKugnZz3+v7m5ubw7+7o6Oj19fX09PTJycna2trx8fHh4eHr6+vW1dKnpqSztbvj4N6srrCyr624u73Gx8fn4+CqrK+tqaOssLeqqqn9/v/y8e/t7u/o6ert7e37/Pzp6Ofn6On6+/v7+/vKysrZ19exr6+9vruwra3d4OPT0Mq7uLeyt73GxMLd3+LR0dC3tLOnqavCw8P29fT29vfw8PDo5+bk5efv8PHz8e/i4+To6evx8O/w8PHv7/Dz8/Pq6urv7+/X19fb19LEw8O0ub3Mycbf4uTGxsS6tK6rsLTCw8TR09Xg4N6/v8DBwsPGwsDAwMDGyczu6+i7vMDCw8XMzs7t6OS+v7/Ix8a7ubm/xszw7ena3N7y8Ozd3uDs7e3n5uXt7vDr7Ovs6unl5eXn5+fZ2dns7u/j4uHj4uPn5+bs7e76+PDz3aH01oT03Z/69u3Hx8fw1pDy14zFxcX49/T713W8oFbHqlu6nlX92XX18+321n/kw2nsymzjwmj41nv6+vj268/62Hn72Hj16cn49vH07Nf49e8Yi/ZlAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUWUOwe9QAAAn9JREFUSMdjYKA5YGRiZmElQh0bOwcHBycXYYXcPLx8/AKChBUKCYuIiolLEFYoyQECUoQVSkvIcHDIyhHjbXkFRSXiAkgZr6yKqqqaGhirawCxGgSrYCpUY9DU0tbRZdADcfQNoKLq2BQaGhmbmJqZW1haWdvY2tk7ODo5u6hhKlQFEa5uDO4eniCWl7cPA4MvAxaFfgiH+avB2QF4/RVIbPoJIqRARQ0YOuqqah7QkArGpVAd7PkQeDCo4VKoFhoWHhEZFR0TGxefkJiUrIpTIYhIYWBI9VTSc2FQwhbaEBAAdGFaOsiVahmZQHYwHv+kwazzTcPr7yyEbdnYvQKNixw1oI1AGmRpLm5/oEY8DoV5+QWFRcUlpWXlFZVV1eo4FarW1LrX1Qc3NDY1t6gEgy3AoRAcd2rZULqFUNLwb4EzfdXwhk+aL8wKDTyqQJHS6gtJOinA8ErHnXoCGJCTtIofDoWqbe0dnV3dPb19/RMmTpochEuhkuqUqdnTvKbPmDlr9py58+b7quMyUW1BGigCoTjNVw1HyaK+sB5Fxl8De8rFkrAWLsJIO8DoyJoGihYVpHhS910MoVXTIa5VgqTCAGDqV1LDkpaUXKC5Qkl9ydJly1esXLV6zVqIwnXrN2zctHnL1pXbtu/YuWv3HqhWJdW9++r2H6idfjDNEyyieujwkaPHjnucSDt56nR97pmzMDvSQQncF5LIkdK7upovtjJIdRqGrxdgj+2MQNSMrBKYgStVZAQuUmI4d/7CxUsMDNMCF+BLjwH+l68Aq5mr1/wDCBVp12/cvHX7zl3ChWPAvfsPHj56TEQx+uQpx7PnRBW4L16+oqjCBwDJ863rDFxGwwAAACp0RVh0Q3JlYXRpb24gVGltZQBEaSAxMSBKdW4gMjAxOSAxNTo1NzoyMCBDRVNUC7HtWQAAABl0RVh0U29mdHdhcmUAZ25vbWUtc2NyZWVuc2hvdO8Dvz4AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"step func\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=87 87w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Jj7Jns100ClC2ukA7sJs0/f8386c605346a1ac82f6762e35059d8b/step_func.png?w=349 349w\"\n        sizes=\"(max-width: 349px) 100vw, 349px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Lambda와 같은 서버리스 서비스는 수행에 대한 제한 시간이 존재한다.\n각 단계가 대부분 람다 기반이다 보니 위 그림과 같이 Loop를 돌며 체크하는 패턴으로 Sensor를 구현한다. Airflow에는 리소스마다 미리 정의된 Operator, Sensor가 많지만 Step Function에서는 이를 다 구현해야 한다.\n만일 Loop를 피하고 싶다면 Fargate로 Sensor를 구현할 수 있지만 Fargate는 요금이 많이 나온다.</p>\n<br>\n<h2 id=\"정리하면서\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC%ED%95%98%EB%A9%B4%EC%84%9C\" aria-label=\"정리하면서 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리하면서</h2>\n<p>쓰다보니 단점만 나열한 것 같아 보이지만 AWS 서비스와 요금은 지속적으로 업데이트 되기 때문에\n나중에는 이러한 제한사항들이 해결될지도 모른다. 그리고 상황에 따라 적절히 사용한다면 장점이 많다.\n그리고 서버리스가 아니라 언급하지 않았지만 Managed Cluster 서비스인 EMR을 사용해서 모두 해결하는 방법도 있다.\n만일 Event 기반의 간단한 ETL 이라면 Serverless ETL이 가지는 장점을 크게 활용해보길 추천한다.</p>","excerpt":"15년 AWS Lambda가 출시된 이후, 뜨거운 반응을 보이며 다양한 서버리스 서비스들이 출시되었다.\n그 중 ETL…"}}},{"id":"f4923e82-cd6e-5ba2-8897-c378854708c3","title":"Spark groupByKey vs reduceByKey","slug":"spark-reduceByKey-groupByKey","publishDate":"August 22, 2017","publishDateISO":"2017-08-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark Application 성능 개선을 위한 <code class=\"language-text\">groupByKey, reduceBykey</code>에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"groupbykey-vs-reducebykey\" style=\"position:relative;\"><a href=\"#groupbykey-vs-reducebykey\" aria-label=\"groupbykey vs reducebykey permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>groupByKey vs reduceBykey</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># reduceByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>reduceByKey<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> a<span class=\"token punctuation\">,</span> b<span class=\"token punctuation\">:</span> a <span class=\"token operator\">+</span> b<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># groupByKey</span>\nspark<span class=\"token punctuation\">.</span>textFile<span class=\"token punctuation\">(</span><span class=\"token string\">\"hdfs://...\"</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>flatMap<span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> line<span class=\"token punctuation\">:</span> line<span class=\"token punctuation\">.</span>split<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> word<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>word<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span>groupByKey<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n <span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">(</span>w<span class=\"token punctuation\">,</span> <span class=\"token builtin\">sum</span><span class=\"token punctuation\">(</span>counts<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>가장 흔히 알고 있는 word count 예제를 예로 들어보겠습니다.\n위의 예시는 reduceByKey를 사용했으며, 아래의 예시는 groupByKey를 사용했습니다.\n둘의 결과는 같지만 성능은 확인히 차이가 납니다.</p>\n<p>먼저 위의 코드에서 <code class=\"language-text\">flatMap, map</code> 까지는 동일한 노드에서 실행이 됩니다.\n하지만 reducer 부분에서는 모든 동일한 단어 쌍을 같은 노드로 이동시켜야 하기 때문에 <strong>Shuffle</strong> 이 발생합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.945130315500684%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAARNSURBVEjHxZb7UxpXFMfzL5m00zShPmpEkUVesqxApbWT6Y+Ztj+0f0Cn/Sk1UxMfE6OgSYzaSWNmqtiHuuwur92AoiIqIqAGIZHlIfKQZXJZjFGWhoRppztnLgfud8/nnnMvZ/dC/n+6LhQ/fu6+ZbFYVl2uvv4Bn8+3tLS0srpqMplH7z+YmTF4vd7e3j6Xy+VwOJaWnECAosa5uQWdXr+9vT03P//Djz/90nPHbrfH4/G+gQGDweB0LtvtDpuNrADuuX378ePfnkxNAcCMwTCs0+E4fnfw3sTE5J9//Q1GvX5kfHwCRdGh4eGtrS232/3g4RiQ/T49PTE5MfX0qcEwq9Pp9/f3R0ZGQZzJyV+HdfqxR+MVwG+5aDoK8ij66XQ6FAq9YzFpms5ms9WD/9s9BldsxWmVwFwLjOpL7vEPDZVVxt2r54UMqdZYZAip/Mwqhq1iBWvw8tffnAPTFLlQw1uo+aTEvD09JWDPze7C1MVSZdTpOM9lTJJ2tKmNgBRnZVRHJwd8sfbEiiLgXKrb4oC37vTiMjUuVr6RgfHDhlJwvgDG+JI3YDYgpdKeA0co0gRrjY0i46dCI6/FeLWJUGqNfLFv6B4XTACwBEE/asQbILReiEMwAXeWyViqAGBcqDDymrF6IQbBuLDdcYNTarOqC+jQOgF6uRG7yjepu4zNkvJg5HNC3LFwqRara0UbIELaYVZquRmbFSr0Whsuguc/qMdqBbhMBcCLN74tBc9zNhhY2VIXwBKk4h5b4AKYECkr7PE7gk8OV02lw5VnLEoW3Ia8DRxfXSYRNaVUU4ialMOWllZSgVBKzc7Y/RJwQK+jYBUJq2ztiEXYRipURUusu0rAdq2WQjRWSbtVIARhi+b67vsTcI5V5RgmyzAFJ5NOBgOpg1DM6zrc9aYOwumDEPgKxnT0IJ8ryJnc8dGL5+BH5jibehk8ehnMpVPF8mZidIrVsxZOPvfH/RvZw2hpAwGwQffaH3u7T/y+h55Nazh0uOM5PkoUp7PJOAiajrw4SSF3DDDRTWfCt5462D8K7SV3PAn/BvATgY241xX3reeymaIYJAAWl4nT/9i5Mmyux6/HXCaVDPpPFen93aOAN7pM0raFCGYIE7PRFSq25gAJZWIRkCKTzaQj4UKF3Iv0oiWMTUfwWdoyH1tbTO0FUsGd9+rVzKlnhaRsRzvb1HgmPsS9xyaFXytPxTy8oeVstPd4SFghOfcAm/iiMsoCuFRZPZjUfIE3S8Ef/zy4TMbPvryOC+SgT/1L4M4urFUGGqSxvpUQFXoeJpCZxQpuuGfXvwJThFyD1raYxB3AB+swy5Eqn8cFMAgh6ShmALou+vE1s1DKBVMsGJdrTpRX+OiVJqK5rdo9lioBCXTviqW2gQZ5uRGIOaWuJmPGCsnKHS6o3BIVXCVRLTjvG7zruXmLte5T2+7v5yrBm8lZzSZr4P20bNhX1Infu98JjA4AAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"reduceByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=365 365w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=729 729w,\nhttps://images.ctfassets.net/tushy4jlcik7/4lMQgfoDcfSD0LRyKCddiF/737f60e7d2574bb8e326ead72c13001b/reduceByKey.png?w=1458 1458w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우선 reduceByKey의 경우, 먼저 각 노드에서 중간 집계를 진행하고 이에 대한 결과를 동일한 키 값으로 전송합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.92436974789916%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMDWlDQ1BpY2MAAEiJlVcHVJPJFp6/pBASWiAUKaF3pFepoYOAdLARkgChxJgQVOzIooJrQUUUK7oqYlsLIIsNCxYWBXtdUFFR1sVVbKi8SQF9vnbePWf++XLn3jvfvZmZMwOAqiNbKMxH1QAoEBSK4sOCmKlp6UxSDyACDGgDY2DM5oiFgXFx0QDKSP/P8u4mQKT9NXtprH8d/6+izuWJOQAgcRBncsWcAoiPAIDrcISiQgAI7VBvOqNQKMUDEGuKIEEAiLgUZ8uxjhRnyrGdzCYxngVxAABkKpstygZARcqbWcTJhnFUpBwdBVy+AOKNEPtxcthciO9DbFdQMA1iVTLEVpnfxcn+p5iZozHZ7OxRLM9FJuRgvliYz571f5bjf0tBvmRkDhPYqDmi8HhpzrBuu/OmRUkxFeIWQWZMLMQaEF/gc2X2Unw3RxKepLDv54hZsGaAAQAKuOzgKIj1IWZI8pICFdiZLZL5Qns0hl8YkajAmaJp8Yr4aJEgPyZaEWdJDi9iBG/miUMSRmyy+KEREMOVhh4pzklMkfNEzxbxk2MgVoH4qjgvIUrh+7A4hxUzYiOSxEs5m0H8NksUGi+3wXQKxCN5YQ4ctmwuuBawgMKcxHC5L5bKE6dGj3Dg8oJD5BwwLk+QpOCGwdUVFK/wLRPmxynssc28/LB4eZ2xg+KihBHfrkK4wOR1wB7lsiPjFHO9ExbGJcq54SiIBiwQDJhAAlsmmAZyAb+jv7Ef/pKPhAI2EIFswAP2Cs2IR4psRAC/CaAY/AkRD4hH/YJkozxQBPVfRrXyrz3Iko0WyTzywFOIC3A93A/3waPhNwA2Z9wT9xrxY6qOzEoMIQYTw4mhROtRHhzIOh82EeD/G10U7HkwOykXwUgO3+IRnhI6CY8INwjdhDsgGTyRRVFYTeWXiH5gzgTjQTeMFqrILvP77HALyNoND8J9IX/IHWfgesAed4WZBOL+MDc3qP2eoWSU27da/jiflPX3+Sj0KjYqbgoWmaP/DGvU6scorO9qxIV91I+W2BLsMNaGncYuYi1YI2BiJ7EmrB07LsWjK+GJbCWMzBYv45YH4/BHbBzrHfscP/8wN1sxv7Re4kLezELpZmBNE84S8bNzCpmB8DTmMSMEHAc7prOjkwcA0rNdfnS8YcjObIRx6ZtuEbTwIw0PD5/4pov6A4DDPQBQ7n/TWZ6C2xXulQurORJRkVwnPY4BAVCAKtwVusAQmAIrmI8zcAc+IACEgEgQCxJBGpgCK54DCiDnGWAOWAjKQAVYCdaCDWAL2A52g33gEGgELeA0OA8ug6vgBrgH10UveAkGwDswhCAICaEhdEQXMULMEVvEGfFE/JAQJBqJR9KQDCQbESASZA6yCKlAKpENyDakDvkVOYacRi4incgdpAfpQ/5GPqEYSkU1UQPUAh2LeqKBaBSaiE5Gs9HpaDFaii5Hq9FadC/agJ5GL6M30G70JTqIAUwZY2DGmD3mibGwWCwdy8JE2DysHKvCarH9WDP8n69h3Vg/9hEn4nScidvDtRmOJ+EcfDo+D1+Gb8B34w34Wfwa3oMP4F8JNII+wZbgTYggpBKyCTMIZYQqwk7CUcI5uG96Ce+IRCKDaEn0gPsyjZhLnE1cRtxEPEA8RewkPiYOkkgkXZItyZcUS2KTCkllpPWkvaSTpC5SL+kDWZlsRHYmh5LTyQJyCbmKvId8gtxFfkYeUlJTMlfyVopV4irNUlqhtEOpWemKUq/SEEWdYknxpSRScikLKdWU/ZRzlPuUN8rKyibKXsoTlPnKC5SrlQ8qX1DuUf5I1aDaUFnUSVQJdTl1F/UU9Q71DY1Gs6AF0NJphbTltDraGdpD2gcVuoqDSoQKV2W+So1Kg0qXyitVJVVz1UDVKarFqlWqh1WvqParKalZqLHU2Grz1GrUjqndUhtUp6s7qceqF6gvU9+jflH9uQZJw0IjRIOrUaqxXeOMxmM6Rjels+gc+iL6Dvo5eq8mUdNSM0IzV7NCc59mh+aAloaWq1ay1kytGq3jWt0MjGHBiGDkM1YwDjFuMj5pG2gHavO0l2rv1+7Sfq8zRidAh6dTrnNA54bOJ12mbohunu4q3UbdB3q4no3eBL0Zepv1zun1j9Ec4zOGM6Z8zKExd/VRfRv9eP3Z+tv12/UHDQwNwgyEBusNzhj0GzIMAwxzDdcYnjDsM6Ib+RnxjdYYnTR6wdRiBjLzmdXMs8wBY33jcGOJ8TbjDuMhE0uTJJMSkwMmD0wppp6mWaZrTFtNB8yMzMabzTGrN7trrmTuaZ5jvs68zfy9haVFisVii0aL55Y6lhGWxZb1lvetaFb+VtOtaq2uWxOtPa3zrDdZX7VBbdxscmxqbK7YorbutnzbTbaddgQ7LzuBXa3dLXuqfaB9kX29fY8DwyHaocSh0eHVWLOx6WNXjW0b+9XRzTHfcYfjPScNp0inEqdmp7+dbZw5zjXO111oLqEu812aXF672rryXDe73naju413W+zW6vbF3cNd5L7fvc/DzCPDY6PHLU9NzzjPZZ4XvAheQV7zvVq8Pnq7exd6H/L+y8feJ89nj8/zcZbjeON2jHvsa+LL9t3m2+3H9Mvw2+rX7W/sz/av9X8UYBrADdgZ8CzQOjA3cG/gqyDHIFHQ0aD3LG/WXNapYCw4LLg8uCNEIyQpZEPIw1CT0OzQ+tCBMLew2WGnwgnhUeGrwm9FGERwIuoiBiI9IudGno2iRiVEbYh6FG0TLYpuHo+Ojxy/evz9GPMYQUxjLIiNiF0d+yDOMm563G8TiBPiJtRMeBrvFD8nvi2BnjA1YU/Cu8SgxBWJ95KskiRJrcmqyZOS65LfpwSnVKZ0p45NnZt6OU0vjZ/WlE5KT07fmT44MWTi2om9k9wmlU26Odly8szJF6foTcmfcnyq6lT21MMZhIyUjD0Zn9mx7Fr2YGZE5sbMAQ6Ls47zkhvAXcPt4/nyKnnPsnyzKrOeZ/tmr87uy/HPqcrp57P4G/ivc8Nzt+S+z4vN25U3nJ+Sf6CAXJBRcEygIcgTnJ1mOG3mtE6hrbBM2D3de/ra6QOiKNFOMSKeLG4q1ITXnHaJleQnSU+RX1FN0YcZyTMOz1SfKZjZPstm1tJZz4pDi3+Zjc/mzG6dYzxn4ZyeuYFzt81D5mXOa51vOr90fu+CsAW7F1IW5i38vcSxpLLk7aKURc2lBqULSh//FPZTfZlKmajs1mKfxVuW4Ev4SzqWuixdv/RrObf8UoVjRVXF52WcZZd+dvq5+ufh5VnLO1a4r9i8krhSsPLmKv9VuyvVK4srH68ev7phDXNN+Zq3a6euvVjlWrVlHWWdZF13dXR103qz9SvXf96Qs+FGTVDNgY36G5dufL+Ju6lrc8Dm/VsMtlRs+bSVv/X2trBtDbUWtVXbiduLtj/dkbyj7RfPX+p26u2s2Plll2BX9+743WfrPOrq9ujvWVGP1kvq+/ZO2nt1X/C+pv32+7cdYByoOAgOSg6++DXj15uHog61HvY8vP+I+ZGNR+lHyxuQhlkNA405jd1NaU2dxyKPtTb7NB/9zeG3XS3GLTXHtY6vOEE5UXpi+GTxycFTwlP9p7NPP26d2nrvTOqZ62cnnO04F3XuwvnQ82faAttOXvC90HLR++KxS56XGi+7X25od2s/+rvb70c73DsarnhcabrqdbW5c1zniS7/rtPXgq+dvx5x/fKNmBudN5Nu3r416Vb3be7t53fy77y+W3R36N6C+4T75Q/UHlQ91H9Y+4f1Hwe63buP9wT3tD9KeHTvMefxyyfiJ597S5/SnlY9M3pW99z5eUtfaN/VFxNf9L4UvhzqL/tT/c+Nr6xeHfkr4K/2gdSB3tei18N/L3uj+2bXW9e3rYNxgw/fFbwbel/+QffD7o+eH9s+pXx6NjTjM+lz9RfrL81fo77eHy4YHhayRWzZVQCDDc3KAuDvXQDQ0gCgX4X3BxX520smiPy9KEPgP2H5+0wm7gDsWwBAPGwsePc4CJsFxLQAAKRX78QAgLq4jDaFiLNcnOWxqPAFQ/gwPPzGAABSMwBfRMPDQ5uGh7/sgGTvAHBquvzNJxUivN9vdZWiLobwA/hB/gEKCm6l7KI/MQAAAuVQTFRF/v7+/f398PDx9/j49PT09/f39vb38fHx7e3u7u7u39/f6urq/Pz8vb2+sLCxt7e4ubm6q6ysxsfHrq6wmpublZaXu7y8mJiZsbGym5ycwcHCwcHB7+/vkJCRoKGivLy9ra2tmpucmZqbq6yt6Ojpk5OUoqKjqamqrq+wvr+/4+Pku7u82NjYyMjJxMTFvr7Aw8PDwsLDpKSl1dXV1NTUv7/A09PTvr6/1tbWrq6vzMzO19fXy8zMwcLDy8vMxsbHqqus+vHv9+nn+Onn/Pf2+e7s/fr514GDvzE8wDE86r271n1/7MHAz2Rmw0VOwkJMwDVAwDE989vZwTpFwTtF7MG/xVdfw0pTwDZC9NrYwjxHwTZCxVVdwkROwz1I68G/xVdgw0pS89vYxVhgw0ROwT9JxlpiwkNNwj5Jx11lw0dQwTlExU9YwT1IwTtG1n2Axltjwj9Kz2RnxVpiwkZQwjtG14GExVhhw0JMwkVPwT5IwjpF57Oy2YSF2YSG2YKD0m1r0W1r03Ny135+8tfU56+u2YKE2IKE1Xh31HR01nt78tnW4qKg13190mpn2YGB2oSF8/r68Pn45/X18fn59+zm/vz8+vLw9OXf9+3q+O3p+O7q/Pj3+vPv9uvm+vXz+fPw9+zo9+7q/vz7+PDs9+3p9url+/b11e/vsuHgtOPhsuHhtuPi5PHu89/X/Pr59uzo/fr6+fHu8uHZ9unk8d3V9OLa8t7W9ebf8+Ha+/b0+vbz+O/r+vPw6ry55K2n5KKc35WM4aSd5Kuk5rWu+/bz/v79+fLw6Lqz46uk36GX4JeO46CZ5bGs6ru6+/Px+e3rwkFKwT5Jw0RNyVFX0G1vxlBZxE5X9Nza+e3qwkhRw0VPxUpT0G9xxE9Yw09X9NzZxUlTxE1Xw0hSxElS0G9wxE5Ww05XxElRwUVPxElTw0lRxEpT0G9ywUNMwUBLwkFMz2lswkBKwTxH5q+v6bu668LAB7j22AAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFGLdUM/IAAAGXSURBVBgZBcE9iBwFAIDR9+3O7s3MbeRAMCDEQmKwCIitFiH40wXBzjK9iJWghY0Q24jYiVjaKRHS5MDuCisbEbzSH7CLXFzudNnzPVqA5WC1hoORaT7kYAMAg01VVVVVVT25UtUvAINrVZ09VdXpjT+fPb1R1Y/Xn64dAIDYYAMABEC4XaBjuL0AOoY39i7FcsC6QGDeA0sw7qyq82mACbgARot2GYDRqi7GgwGYLsYtAFOdmQHm/mUagGluC8BcZ7YAU/OWBTBNE8B1ZhMzeIF5njHgpVN/AICD8THA6cBqhwEAAH4FAH89t8aA9c2q6iE8c7Vq1wBu9c+mbvm+z3rv8979ovbLulRVd7+u2l52+OSK3oG+qaq3+ba/j97yoH6/Vvtl/63f9Oi37gIBx73my+dVVa9yUlWll0EA/FR9jE9ugp/rI/j0RTAAMFUAGAuMwAIA979agRNgOAeABQA+tASvgHE4AoAFAFbvrwFwfg8ALACwvL8AJ+DIYwAYALD8IAAM9wKAAHj9O6BDsN0Dd34A/wOkCk1s++qPwQAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"groupByKey\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=357 357w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=714 714w,\nhttps://images.ctfassets.net/tushy4jlcik7/6XcUgU5bN51jHzig363qGr/84a4cf5389ea34f79862c0e3181730bf/groupByKey.png?w=1428 1428w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>반면, groupByKey는 각 노드에 있는 데이터에 대해 바로 Shuffle 과정을 거치게 되고 결과를 내보냅니다.\n따라서 groupByKey는 네트워크를 통해 전송되는 데이터의 양이 많아질 뿐만 아니라, <strong>Out of disk</strong> 문제가 발생할 수도 있습니다.</p>\n<p>Shuffle은 기본적으로 비용이 큰 연산입니다.\ngroupByKey는 reduceByKey로 대체될 수 있기 때문에 많은 문서에서 이를 권장하고 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs\">https://www.slideshare.net/databricks/strata-sj-everyday-im-shuffling-tips-for-writing-better-spark-programs</a></li>\n</ul>\n<br>","excerpt":"Spark Application 성능 개선을 위한 에 대해 알아보겠습니다. groupByKey vs reduceBykey…"}}},{"id":"990a6e60-c773-50b0-a6c0-a9c79431c620","title":"AWS EMR에서 S3 사용 시 주의사항","slug":"aws-emr-s3-spark","publishDate":"September 09, 2017","publishDateISO":"2017-09-09","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>AWS EMR에서 Spark을 사용하는 경우, S3를 저장소로 사용하는 경우가 많습니다.\n이때 주의해야 할 사항들을 정리해보았습니다.</p>\n<ul>\n<li><strong>최근 수정사항</strong> : 해당 이슈는 EMR 최신 버전에서 대부분 해결되었습니다.</li>\n<li>자세한 내용은 <a href=\"https://aws.amazon.com/ko/blogs/korea/improve-apache-spark-write-performance-on-apache-parquet-formats-with-the-emrfs-s3-optimized-committer/\">Parquet 형식의 EMRFS S3 최적화 커미터를 통한 Apache Spark 쓰기 성능 개선하기</a> 에서 확인하시기 바랍니다.</li>\n</ul>\n<br>\n<h2 id=\"aws-emr-spark-그리고-s3\" style=\"position:relative;\"><a href=\"#aws-emr-spark-%EA%B7%B8%EB%A6%AC%EA%B3%A0-s3\" aria-label=\"aws emr spark 그리고 s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>AWS EMR, Spark 그리고 S3</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.91489361702128%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAACMVBMVEX+/v7HyMno6On////7+/v+8Ob7zq7/+fb8/Pz39/f19fWeoKHQ0NH09PT5+fn2uIz4qXD1sYH29vbz8/O4ubri4+P38ez16N/58u38+vnTsZ7yvZj++PT69/Wwg2nMj2T78uvhw7H5yKb///76+vnh4eHi4N7j3dnf4N/u7u7s7Ozj4+Pm5ubv7+/t7e3s7O3n5+fr6+vw8PDu7e7x8fL9/f3l5eXd3d3y8vLl5ebm5ufq6erm5ebi4uLT1NXFxsfU1dbU1dXx8fHHyMrCw8Xq6+z87+703Nrt6Oj++/n++fj86uj++vrw7/Cux+Dp8fnh4OHe3d7Oz9D4+Pi1trdzdXeoqarY2NibnaCdn6LY2Nrdc2bdb2Lsta/95dTvtIz859jiiX7cal3mmpGQtdgpaatEgbzs7e7R0dHn5+XJyMrm5uiys7Rtb3G5urt/goZlaG3W1tbV1dXe3t7uqqLpg3foyMTwsIPmp37oz7/b29vws63slIrrs6za2tuLstY+frns7e39/v7X2NfAwL/j5OWysrOkpqjv4d/jwr339fT8+/v6+fn04tX15+boubP57+7+///6+/2du9rf6/bw8O/5+fjb2tnMzMzS09Lc3NzJysrU09PLycr6+vvm5uTIycrGxMTJycfp6+3q6ejKy8vR0tT6+vr+/v319vb5+frp6enj4+T29vfz8/TR0tPZ2tvk5eTc29zv8PDg4eHX19jW1tXu7u/e3d3a2trY2dnBE5nbAAAACXBIWXMAAA7EAAAOxAGVKw4bAAAAB3RJTUUH6AEUCgUYt1Qz8gAAAaFJREFUGBkFwU9ozQEAB/DP973f2+PHev6MKamJdhkXGmccuKyRpSRE3GTFQQ6Sg3JQoiRnyWEXbeIgxU3RhKy4uGhCk01+9Lb1fD6RBOnUkgWAxr86XW0ASJkE+bM8WQAAQGMWKJYmP1E2m8kcrE3yFYC0ZkHRroD6DKBIAoDOPFADADBdr9cBAFAAAGxMkv5PAAAKaK2TxELQaSw0kgHzS8l81xuAAja8tdoMg0Dz/ZZCE6a2AyigU9dWZxKD1bttmztvQLm1AnZEDboBGGx/KMqpz4PQ3/duxSJaGo2uYtPKvFiyKy/BnuSpTrdfc3uTb+seWzn8yFDGX+9LsTkZSQKsSTiSo/c+7kyecCI5lR8PHU9yJrk1mu+9CePDyeKXvqTdTFItu3Fuen2uV1yeGCp6k3pvnk2oaPUkF68lz59uPZz0nLO6J7dP3+SKyWJVzrpECVeTuHsh+w8kSViVfDKy/2QxMJruCpQqAADcTw6Xv8fu/D2fdFegVAEAAMrKWHKsBgAAAACXa7X72f3qQZJDXbOtNsBYchDAwOIk+A/+bWtqxiVAOQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws etl\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=235 235w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=470 470w,\nhttps://images.ctfassets.net/tushy4jlcik7/42em7Q8QIJrKivVBAcXn3K/90f2243f818235bb929ef8a54b4d4894/aws_etl.png?w=940 940w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Daily로 돌려야 하는 ETL 작업의 경우 위와 같이 간단한 아키텍쳐로 구성하는 경우가 많습니다.\n대부분의 경우 저장소로 S3를 적극 활용하게 됩니다.\n최초 입수되는 로그를 저장하기도 하고, Transformation 작업 이후 중간 또는 최종 데이터로 저장하기도 합니다.</p>\n<br>\n<h2 id=\"문제-상황\" style=\"position:relative;\"><a href=\"#%EB%AC%B8%EC%A0%9C-%EC%83%81%ED%99%A9\" aria-label=\"문제 상황 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>문제 상황</h2>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">java.io.IOException: Connection reset by peer\nERROR ContextCleaner: Error cleaning broadcast 5</code></pre></div>\n<p>최근 Spark RDD 코드를 DataFrame으로 리팩토링 하던 중에 위와 같은 오류를 겪었습니다.\n일별 로그를 불러와서 전처리하고 다시 저장하는데 s3 write 부분에서 갑자기 Executor의 Connection이 끊기는 문제였습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.94535878867676%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAABdGlDQ1BpY2MAACiRY2BgKkksKMhhYWBgyM0rKQpyd1KIiIxSYL/DwM3AwyDEYMUgnphcXOAYEODDgBN8u8bACKIv64LMSvP8edOmtXz+FjavmXJWJTq49YEBd0pqcTIDAyMHkJ2cUpycC2TnANk6yQVFJUD2DCBbt7ykAMQ+AWSLFAEdCGTfAbHTIewPIHYSmM3EAlYTEuQMZEsA2QJJELYGiJ0OYVuA2MkZiSlAtgfILogbwIDTw0XB3MBS15GAu0kGuTmlMDtAocWTmhcaDHIHEMsweDC4MCgwmDMYMFgy6DI4lqRWlIAUOucXVBZlpmeUKDgCQzZVwTk/t6C0JLVIR8EzL1lPR8HIwNAApA4UZxCjPweBTWcUO48Qy1/IwGCpzMDA3IMQS5rGwLB9DwODxCmEmMo8BgZ+awaGbecKEosS4Q5n/MZCiF+cZmwEYfM4MTCw3vv//7MaAwP7JAaGvxP///+96P//v4uB9gPj7EAOACR3aeD+qnTyAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUYt1Qz8gAABTpJREFUSMeFVltv3EQU3n/TvvHAAy8gUQEFxAMSkbi8FInSBxDl0qhIEASIqAiEBKpUCfEEFUhtQlXalMA2KQmtmqRJ05DNbvZ+tb322p6xN2t7N2u7Et/MOM4m7aZHJyfHk5n55lzmmyQcx7Fte6vd3toRXdcbjUa9XldVtdlsapomnK29Qghpt9tNWXYdRyg2wTxFUfADB8sUWW7x9U6nE0+DEtNMABib9jwv7PeDWH0ftl6hlRLXItlcrsOKz9wKfGoaJk6c3tgIff8+1zC2QSCcsGMHtMmUKLuOpVJCGLBpmr1uF/OCWCG+Xy3TUoGWirDk8i8pWO7T336CTw0OnM/nQwETBKEAw6fwg8AjqyS4xtSfEo7pX231p6OIkbRBYLGGA1tAKkML5MzYEix8jIx/fBuWELov4vsPROyRZYAZ/lW597vAnqM/rHXO25adQLgoaq/XE2BDgOnoiblCpiWAR9+/A0uphRoVCoXdiHcCjSN2OfC8fXbOOisi/rR07Lz6JU6cMAwD9d/mEe8qX1krM0gR8bGR2c2ULg7x7hvJct4EMFK1cWCNXbIEsDP3Pvksc0JE/ObM8ecXn2URO7zH9teYa7VgxjUeeXk+e2NV1PilZ66XljYBjK4uoMYCL64xBxaOQxcA9sV3fz05+cp47e3x2vGjo+eevvIqi3gX+IFUL8xLQMqtSojyhSMzkz+uiFQ/d2R2+udlAONS5bLZAyJOKxMX9LGRkxeOvvXr4X8PHb556MXXpl4/PhNFzLr6YTVOXqvl0vrViWI2bTz+2PS3X62VOPBTTyS//3oNRQawJEme69qUdl0XF7RtWfjstO2l/ybvZv44N3HxnW8unh6999HJ5VMf3D19au3D9+58PrbOrlOzqYIuarXaZiYjyzKII5vNVqtVjGTSeVUx6rVmo64oslGrKnJd0XWzUpYlSTMNI50pViqVUqlULpfhYFWxWCxzgQ/asbngfJbF6hI7LNX1TGplZSWVSmUyGVxK2Fwut76+ji1AXlvDBRFvZNcwM51OAxVrsUl2RzDyINnFwoC1pobTVcoVxM0i5tEDEhYrKaHDlF2HugSCRLY1LiqX+BMVPODcCfwgae6A6K0WToD1hg43Emzk7hXOd71B8TxP54I/4aYJhkBi4He73X0zE6JBwMwh52ehuz7vtZi9B+dgOxQMjwRuRI/v2/U8KLoVFr/QZbHGc2Bdx8NpGDCyuoc9HqZNpb9vBBExYEURVHU/DCPO4n7k7Iz723483tI8VCohFgc7V2jwOglKEcygqn7XjcbbFhu3LSbog4gsh2un0wOY8HHdGDAixkpEHMMwR6SUO9E5+v1iQbGtaDyXpQIYJRTAB0csq+2W5orxsoS+cVlXo3HQioPA8bMYqesGhCzNLLaKeFApdPbywrZhABg9iOWPjNhue6plMj8MFWrAZ8CiuQ4qMCGwM8nFdKoiRi5fWpTqDQCL7g15rKGQfQ63Faq0bEsMF0hNtWkEHEU8pMYdTXf8zqWpv5NzC27gOL4zeSV5687dwRofnOq8WW1ZVIwXSVW1SASMdIFmcWth8c+RyR3QWrGQair5m/NL6Vx97tbNP5P/VOWGRuh0cvb6jdvUJI9uLvwv4LsNqmoWYb0d9GtEiVKdl0B2eTAc2Ao5R9ng4BNpAGuC1IZRDw+YPcmdTgekBYsc4PSMTcFrugFuRimautZq2VWpwd5vm0iSqhq6ha6uZipFLgJblhhngfdxAhwIjjVEGFfnc7gRYm25xB4G8VSA7bEWu1nD5X8NwMohjt6YLwAAADJ0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgQ29tcHV0ZXIsIEluYy4sIDIwMTAdk7liAAAAGHRFWHRpY2M6ZGVzY3JpcHRpb24ASEQgNzA5LUGy21rxAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ganglia a\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=380 380w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=760 760w,\nhttps://images.ctfassets.net/tushy4jlcik7/4z74wIoWoAnpKnD18o41oi/cfa3769ca97f862bf04c85659db82b8a/ganglia_a.png?w=1519 1519w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<p>Ganglia 모니터링 결과를 보면 중간에 약 15분의 공백이 있는데,\n이 부분이 Connection이 중간에 끊기고 다시 뜰 때까지 걸리는 시간입니다.</p>\n<br>\n<h2 id=\"s3n-s3a-s3\" style=\"position:relative;\"><a href=\"#s3n-s3a-s3\" aria-label=\"s3n s3a s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>S3N, S3A, S3</h2>\n<p>먼저 S3는 File System이 아닌 <strong>Object Storage</strong> 라는 점을 알고 계셔야 합니다.\n따라서, S3에 분산저장하는 경우, 우리는 Hadoop 클라이언트를 거쳐 저장하게 됩니다.\nHadoop은 <code class=\"language-text\">S3N, S3A, S3</code> 이렇게 세 가지 시스템 클라이언트를 제공합니다. 각 클라이언트는 URI 스키마를 통해 접근할 수 있습니다.</p>\n<ul>\n<li><strong>S3N (s3n://)</strong> : S3N은 S3에 일반 파일을 읽고 쓰는 기본 파일 시스템입니다. S3N은 안정적이며 널리 사용되고 있지만 현재는 업데이트가 중단되었습니다. S3N의 단점은 파일 엑세스가 한번에 5GB로 제한되어 있다는 점입니다.</li>\n<li><strong>S3A (s3a://)</strong> : S3A는 S3N을 개선한 다음 버전의 파일 시스템입니다. S3A는 Amazon의 라이브러리를 사용하여 S3와 상호 작용합니다. S3A는 5GB 이상의 파일 액세스를 지원하며 성능이 많이 향상되었습니다.</li>\n<li><strong>S3 (s3://)</strong> : S3는 Hadoop 0.10 버전부터 나온 블록 기반의 S3 파일 시스템 입니다. 따라서 파일이 HDFS에 있는 것과 같이 블록으로 저장됩니다.</li>\n</ul>\n<p>EMR은 EMRFS 라는 파일 시스템이 별도로 존재합니다.\nEMR의 S3 파일 시스템과 Hadoop에서의 S3 파일 시스템은 서로 다르기 때문에 항상 주의하셔야 합니다.\nEMR의 경우 <strong>s3</strong> 로 사용하는 것을 권장하고 있습니다. 반면에 s3a의 경우 EMRFS와 호환되지 않는다고 합니다.\n물론 실행 될 때도 있지만 위와 같은 오류가 발생할 수도 있습니다.</p>\n<br>\n<h2 id=\"parquet-저장-성능-개선하기\" style=\"position:relative;\"><a href=\"#parquet-%EC%A0%80%EC%9E%A5-%EC%84%B1%EB%8A%A5-%EA%B0%9C%EC%84%A0%ED%95%98%EA%B8%B0\" aria-label=\"parquet 저장 성능 개선하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Parquet 저장 성능 개선하기</h2>\n<p>위의 오류는 URI를 s3로 수정해서 해결할 수 있었습니다.\n하지만 S3에 parquet로 저장하는 속도가 너무 느려 이 부분을 개선해보기로 했습니다.</p>\n<p>먼저 Spark에는 Parquet 빌드 속도를 개선하기 위해 <code class=\"language-text\">DirectParquetOutputCommitter</code>라는 기능이 있었습니다.\n하지만, S3에 저장할 때 이 기능을 사용하는 경우 데이터 유실이 발생할 수 있었습니다.\n<a href=\"https://issues.apache.org/jira/browse/SPARK-10063\">SPARK-10063 JIRA 티켓 참고</a></p>\n<p>이러한 이유로 Spark 2.0 버전부터 이 옵션은 사라졌습니다. 그러나, 성능 개선이 필요했기 때문에 Spark 사용자들은 대안을 요구했습니다.\n본래의 FileCommiter가 느린 이유는 rename 연산 때문이었습니다.\n실제 파일 시스템(HDFS)에서 rename 연산은 대상 파일 시스템의 임시 디렉토리로 출력 한 다음, 디렉토리의 이름을 커밋하는 방식으로 O(1)이 소요됩니다.\n하지만 Object Storage에 저장하는 경우, 데이터 사이즈만큼 O(N)이 소요됩니다.</p>\n<p>이 문제는 s3guard와 s3a의 도움으로 해결되었습니다.\ngetFileStatus()에서의 S3 HTTP 콜을 생략하고 dynamo metadata 저장 등을 통해 해결했다는데 자세한 내용은 <a href=\"https://issues.apache.org/jira/browse/MAPREDUCE-4815\">MAPREDUCE-4815 JIRA 티켓</a>을 보시는게 나을 듯 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version 2\nspark.speculation False</code></pre></div>\n<p>적용하는 방법은 위의 Spark property 옵션을 추가해주시면 됩니다. Spark 2.1, Hadoop 2.7.2 버전 이상부터 사용가능 합니다.\n하지만 Spark 문서에도 나와있듯이 아직 failure에 대한 보장이 떨어집니다.\n따라서 먼저 로컬 HDFS에 임시저장 후 distcp 명령어를 사용하여 S3로 저장해주시면 됩니다.\nHadoop 2.8 버전부터는 s3guard가 기본으로 들어가기 때문에 안정화 될 것 이라고 합니다.</p>\n<p>결과는 로그 1억 건 기준 <strong>약 10배</strong> 의 성능 개선을 확인할 수 있었습니다.\n두서없이 정리하다보니 좀 글이 복잡해졌네요. 결론은 '옵션을 추가하자' 입니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://github.com/steveloughran/hadoop/blob/s3guard/HADOOP-13786-committer/hadoop-tools/hadoop-aws/src/site/markdown/tools/hadoop-aws/s3a_committer_architecture.md\">S3A Commiter가 아키텍쳐 및 구현 세부사항에 대하여 정리한 글</a></li>\n<li><a href=\"https://aws.amazon.com/ko/premiumsupport/knowledge-center/emr-file-system-s3/\">AWS 공식 문서에서 정리한 글 : S3N, S3A, S3</a></li>\n</ul>\n<br>","excerpt":"AWS EMR에서 Spark을 사용하는 경우, S…"}}},{"id":"376bb950-886b-5e07-b4c5-4a8ab940dfb2","title":"Hive Metastore 구축 관련 문제와 해결과정","slug":"hive-metastore-issue","publishDate":"August 11, 2017","publishDateISO":"2017-08-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.1 입니다.</p>\n<br>\n<h2 id=\"hive-partition\" style=\"position:relative;\"><a href=\"#hive-partition\" aria-label=\"hive partition permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Partition</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> EXTERNAL <span class=\"token keyword\">TABLE</span> table_name <span class=\"token punctuation\">(</span>\ncol1 STRING<span class=\"token punctuation\">,</span>\ncol2 STRING\n<span class=\"token punctuation\">)</span>\nPARTITIONED <span class=\"token keyword\">BY</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span> STRING<span class=\"token punctuation\">)</span>\nSTORED <span class=\"token keyword\">AS</span> PARQUET\nLOCATION <span class=\"token string\">'location'</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>Hive에서 보통 위와 같은 쿼리로 테이블을 생성합니다.\nMetastore는 말 그대로 외부에 있는 테이블의 정보(스키마, 파티션 등)를 저장하는 개념입니다.\n따라서 <strong>EXTERNAL TABLE</strong> 로 생성하지 않은 상태에서 테이블을 DROP 시키면 다 날아가게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name\n<span class=\"token keyword\">ADD</span> <span class=\"token keyword\">PARTITION</span> <span class=\"token punctuation\">(</span><span class=\"token keyword\">key</span><span class=\"token operator\">=</span><span class=\"token string\">'2017-08-11'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<p>도중에 Partition key를 추가하고 싶을 때는 위와 같은 쿼리를 통해 추가할 수 있습니다.\n그러나, 추가한 정보가 바로 반영이 안될 때가 있습니다.</p>\n<p>이 경우에는 <code class=\"language-text\">MSCK REPAIR TABLE table_name;</code> 쿼리로 해결할 수 있습니다.\nMSCK는 Metastore Check의 약자라고 합니다.</p>\n<br>\n<h2 id=\"hive-metastore-parquet\" style=\"position:relative;\"><a href=\"#hive-metastore-parquet\" aria-label=\"hive metastore parquet permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive Metastore, Parquet</h2>\n<p>먼저 겪었던 문제에 대해 설명드리자면 Hive Metastore에 분명히 테이블이 들어가있고,\nHue에서는 잘 보이는데 Zeppelin에서는 모든 데이터에 null 값이 찍혀있었습니다.</p>\n<p>우선 Spark으로 Hive를 사용하는 방식이 2.0 버전 이후 부터 조금 변경되었습니다.\n이전에는 HiveContext를 사용했다면, 이제 SparkSession에서 <code class=\"language-text\">.enableHiveSupport()</code> 추가만 하면 됩니다.\n제플린에서는 SparkSession이 spark이라는 변수로 제공되는데,\n이 경우 interpreter에 <code class=\"language-text\">zeppelin.spark.useHiveContext=true</code>를 추가해서 사용할 수 있습니다.</p>\n<p>다시 문제로 돌아와서 좀 더 확인해보니 컬럼명에 대문자가 들어가면 모든 값이 null로 출력되고 있었습니다.\nSpark 공식문서에 이와 관련된 내용이 잘 나와있습니다.</p>\n<p>Spark SQL에서 Hive metastore로 데이터를 불러오는 경우, 성능 상의 이슈로 SerDe 대신 Spark SQL의 <strong>MetastoreParquet</strong> 를 사용합니다.\n이때 주의사항으로 Hive는 대소문자를 구분하지 않지만, Parquet는 구분합니다. (Hive is case insensitive, while Parquet is not)</p>\n<p>이를 위해 Spark 2.1.1 버전부터 새로운 Spark Properties가 추가되었습니다.</p>\n<p>따라서, Zeppelin interpreter에 아래의 설정 값을 추가해주시면 해결됩니다.\n<code class=\"language-text\">spark.sql.hive.caseSensitiveInferenceMode = INFER_AND_SAVE</code></p>\n<br>\n<h2 id=\"hive-tblproperties\" style=\"position:relative;\"><a href=\"#hive-tblproperties\" aria-label=\"hive tblproperties permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Hive TBLPROPERTIES</h2>\n<p>위에서 말한대로 Spark Properties를 추가하면,\nHive metastore의 parameter에 <code class=\"language-text\">spark.sql.sources.schema.part</code>가 생기게 됩니다.</p>\n<p>여기에서 \"field: name\"에 대소문자가 잘 구분되는 경우, 문제가 없지만 간혹 소문자로 들어오는 경우가 있습니다.\n이 경우에는 아래의 쿼리를 통해 Hive parameter를 수정해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">ALTER</span> <span class=\"token keyword\">TABLE</span> table_name <span class=\"token keyword\">SET</span> TBLPROPERTIES <span class=\"token punctuation\">(</span><span class=\"token string\">\"spark.sql.sources.schema.part.0\"</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"fix this line\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">;</span></code></pre></div>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion\">https://spark.apache.org/docs/latest/sql-programming-guide.html#hive-metastore-parquet-table-conversion</a></li>\n<li><a href=\"http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22\">http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-21-to-22</a></li>\n</ul>\n<br>","excerpt":"Hive Metastore를 구축하면서 겪은 이슈와 해결과정을 기록해두려고 합니다.\n사용 환경은 Spark 2.1.1, Hive 2.1.…"}}},{"id":"23b4638b-e66d-5c9f-8991-cf5a0965756b","title":"Kafka Connect로 S3에 데이터를 저장해보자","slug":"kafka-connect","publishDate":"November 16, 2018","publishDateISO":"2018-11-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent에서 제공하는 Kafka-Connect-S3를 활용하여\nS3로 데이터를 저장하는 방법에 대해 정리해보려고 합니다.</p>\n<br>\n<h2 id=\"kafka-connect\" style=\"position:relative;\"><a href=\"#kafka-connect\" aria-label=\"kafka connect permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka Connect</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.57142857142858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAACXBIWXMAABcSAAAXEgFnn9JSAAAAB3RJTUUH6AEUCgUXJ+suYwAABFxJREFUSMe9VVtvGkcU5ldHqlS1ah8sNS9toqhNVal1m9i52LVjx8TB3GIb1oGAAeM1sMawwLIsu+yFvc1lbx18BezY2A8djUbamTPn2+9855wJBV8Znt139aZn8T6Ufah6thDMNjzTBCcN2O6gDgfZlquqnmFcNwt97T4W87X0fJVaaDH7At/2oRL4/izAqCe01t8XFl8V3i6VFl9ZNH1f4Kx6HB5W3wxrKyb/xbN6QTATsCPL2s5uP56orKyK0ZhdY0gM7gHsGu0qXSzsvMptPa9kVh25NHuo+VaLzuXyyWQ5leo1GvcDJtJCCG1DJmIHvuMjBWPgAckzORcZnudNWvvnQvg+byjIMpVez7MsAkmmj/FswB4aecAG0fU0s04nEI+SPxXXH9Hhb1qJ74AhXYF63vHGBhuPsxTFxGNi/ksw+Vue67oITQMTWhhjcuT7xIPnuxC3NoizawHk+qkfmN05Nv3EKv8aeM6VKBiz4fBxJFJPxLt7lLab8l33SnIINx8/zi8tocmAhwaDwfHpKBaLDMMcFDKYfX+Tch1h99ty/EcuNYe5yNSpVan0KYpOxNlYnPuccS+AXcepxmLxp0+PIltCtToB3O12O52OLMuqqvI8L4scZtfHE3gIsQpQWzN53WpoqmTZim2PuyAGsg07mk7MNIjP7M+ODFE8ikQa1J4pSXCKsaKQPOiR1TAMSZIQ0EeMx0KtAbSZL3+/sPoikiyesBZ2FHtCsK5u/ZHMzC2F//kYTxxUKqLaN8F5Tdq2AwCbydiaNq0xoZvNZguFAon5KFNc2yEajzFuKPpSkfkrz6zQzeXDxqcTTjAmGPO6PZ+lf8tU/t5nYnWOFuTu0Bo3IIyBrt+R1b5jOa0P48Akbq1efztXXN75vLxNHbHty0hehoQVxO1cIV0sU/tFvidokwZEZktR7gJ2gdPZGt8hMIoNiYqiZUsWIJ8DC5L/8vxR8ZJVAZBMsn/c5xRloAw1SVV817ksNiaZxADcBYx13Fyb2tw4yLxMR3+JrT5JvHud/bSYTS6kY/M7H599WH4eXXtJxVZK1It0ZC36mspF3r77c2cv0qzRV8WWzfqedxcwkHArPLXJKMKJKnKGkuEbtMyzmtRQxbLEHUpcXRGamnQw4DhZqB1la7V9ReGhNUT2eQ7bqlqNRjmOo2m6UqmUSiWy1uv1SWAXOt04bqyOstrDN7ZSGVqBrgQ8e1XEDrKdC2PCbJKc3u8fbm4ihM6K27JGeSeKYmgqs2DhZ1R/4wopovaNwANg6qYWqIPTOtUQME0H3fJmQMPoM0y1Ws3n84Qoy7K1Wq3dboemJT75F9G/O1zitgcIo0CRAmAFqhS4zu2PFVGX9C9dJ8z7pE2hi6Y9rbE3rIPdR57K3OZsKAdCJ0AwmHmQtthsNglR/aKgryUXUt1B8W5PwA4c7NcPg4eO0EMuaXKgq6cCgv8XmJQKtAF4OOoDgYlO5XKZPKPkMX0w8H8J/zwhbeSBngAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-connect\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/2mWppdxvRf1FLV0JkREObB/d5344d95f7010f99e1bbaebe1f518179/kafka-connect.png?w=700 700w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>우리는 서버로부터 생성되는 데이터를 실시간으로 Kafka에 보내기도 하고,\nKafka Topic에 쌓여있는 데이터를 실시간으로 RDBMS, Object Storage와 같은 시스템에 보내기도 합니다.\nKafka Connect는 위의 그림과 같이 다양한 시스템과 Kafka 사이의 연결을 도와주는 역할을 하는 컴포넌트입니다.\nSource System에서 Kafka로 들어가는 Connector를 Source Connect라 부르고,\nKafka에서 Target System으로 보내는 Connector를 Sink Connect라 부릅니다.</p>\n<p>Kafka Connect는 JSON, Avro, Protobuf 등의 다양한 직렬화 포멧을 지원하며\nKafka Schema Registry와 연동시켜 공통된 스키마 지정을 할 수도 있습니다.</p>\n<p>사실 Fluentd와 ELK Stack에서 사용하는 Logstash 등 서로 다른 시스템 간의 브릿지 역할을 하는 프레임워크들은 다양하게 존재합니다.\n하지만 Kafka Connect가 갖는 강점은 Kafka와 긴밀히 연동되어 있다는 점 입니다.</p>\n<p>Kafka Connect를 사용하지 않고 데이터를 실시간으로 전달하기 위해서는 Producer, Consumer API를 사용해야 합니다.\n이 과정에서 이미 처리되거나 실패한 데이터를 추적한다거나, 데이터 분산처리, 작업을 배포하는 등의 작업을 수행해야만 합니다.</p>\n<p>Kafka Connect는 앞의 모든 작업을 수행할 뿐만 아니라 connector task를 클러스터 전체에 자동으로 배포합니다.\n또한, Connect Worker 중에 하나가 실패하거나 Network partition이 발생하더라도 실행하던 작업을 나머지 Worker들에게 자동으로 재조정합니다.\nOffset을 자동으로 관리, 유지하기 때문에 재시작하더라도 중단 시점부터 다시 시작할 수 있고 (Exactly Once Delivery),\nHigh performance Kafka library로 작성되어 빠르며 불필요한 polling 작업을 수행하지 않습니다.\n무엇보다 코드 한 줄 없이 사용하기 편하다는 것도 큰 강점입니다.\n혹시 Kafka를 이미 중앙 집중형 로그 저장소로 사용하고 있다면 Kafka Connect를 고려해볼만 하다고 생각합니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3\" style=\"position:relative;\"><a href=\"#kafka-connect-s3\" aria-label=\"kafka connect s3 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3</h2>\n<p>이 글에서는 Confluent로 Kafka를 설치하지 않은 경우를 예시로 들겠습니다.\n이미 confluent-hub를 설치하셨거나 Confluent로 Kafka를 설치하셨다면 공식문서를 따라가시면 됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 519px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 69.94219653179191%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAB+FBMVEX////82b/3mVb7zKv+9vD//v3+9Oz++PP+9e3++fT++fX+8Ob3nVz3oGH3omT+8un+9/H+9u/+9e7+9/L/+/j///765dfxhDb3p272mlfxhzr54tH27eby5dz17OX68+7ktJL6xqD/+vb//PrjtZTQcSz1hTT0zrP09PT7+/v+/fr56rb99uD++vb+9/D61Lj8/Pzw8PD9/f3DuqieonDQ3rr/+/n89/TnvZ77zazl5eXPz8/S0tLt7e2ftrROnaKf3uT5+fn3+/u96OTj9vT5+Pi7urrJyMjR0dHBwMHPzs7HxsbLysrMzMzBwMDk5OT++vf++PT+/v7q6uro6Ojt7O3p6Ojp6enq6erx8fH6+vrAwMD36eDeonb5tob+9O2AgIC3t7fX19fa2tryzLHc3Nzn5+fU1NTExMSOjo6UlJS9vb2ysrKwsLCPj4+enp7JycnkuZr82L91dXVvb2+oqKiSkpKRkZGlpaWioqK0tLT+/fztz7r83cfh4eFycnL++PLx4uHQe3L64d/alI3XbWKrPzO9YlnWi4Tr6+vGc2rSTT++RTmuPzTOdWz/+vf04tXZk2H4qXHb29vg4ODSf3bYUEHFUUWoPjTnurbakYrDUUbZjYXktbDnv6PQcS31hjb83Mb58/Ljsav98vH//Pny3c/96do5wjAOAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCgUXJ+suYwAAAaxJREFUGBmNwb1rE3EAx+HP9/xdcnepfSGxk9AhGaRQ9EIdLTg4OCgOgoIFka7d1VGroJu46SAoVHEU/A8Kvgw1RYsOEgfBRRFRk1xetOfvaLVJe4l5HvGXrF/0JVwl2llJSGrhKfqdi9QeacexlFELr77RUeHn6BesSSU+kWpfTfKabNov9JF+DD5DKRhgStIHBhszHXAlHUDvSDEtrWMFZvo1lidEjzK8AnyJhG/eQ176XCWkhycdWYGcROKrA7x88bzKTs8ct1YGYwyU4bu8JpvCCj3CyjH98+SUc5y+9lq1EcvP8QafLSEcPce2kG5Fk42Yl3Qfq+Ve0I94vPaYXQJNfKMkza0yq23R20nyd+lSME048ZTRClQOlaaUiJ1gBUK6jRkgOKMlrLWTWq+ukSqPx5aQXiHdZpxLDHTl6hKJhnOTQa4ZY26QMEFEurPA4YwsrEUTwy3pcp0dTgcLi+igpAbWdfkRJWluFSrsdkfWAlCUH3FP0nnSPZDmsZaZAB4+4n9mGGcogbOHoWRMkUZWTfy6E8QRXtzakOjgEsdOVk18NS7ejoLiH401aoQMzHNsAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"aws-kafka-s3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=130 130w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/21zWPaE3XlmJ7SEbgx7l2R/e9eccd7884089f1eed5aad9c66ac11c7/aws-kafka-s3.png?w=519 519w\"\n        sizes=\"(max-width: 519px) 100vw, 519px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>데이터 인프라가 AWS 환경에 구축되어 있다면 S3를 Cold Storage로 많이 사용하게 됩니다.\n최대한 단순하게 그림을 그려보면 위의 그림과 같은 아키텍쳐가 나오게 됩니다.\n여기에서는 Kafka에서 S3로 실시간 데이터를 저장하기 위해 Kafka-Connect-S3를 사용하게 됩니다.</p>\n<p>먼저 confluent에서 kafka-connect-s3를 다운받아 plugins 경로에 추가합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">wget</span> https://api.hub.confluent.io/api/plugins/confluentinc/kafka-connect-s3/versions/4.1.1/archive\n$ <span class=\"token function\">unzip</span> archive\n$ <span class=\"token function\">mkdir</span> <span class=\"token parameter variable\">-p</span> plugins/kafka-connect-s3\n$ <span class=\"token function\">cp</span> confluentinc-kafka-connect-s3-4.1.1/lib/* plugins/kafka-connect-s3/</code></pre></div>\n<p>이제 kafka config 경로에 <code class=\"language-text\">connect.properties</code>라는 이름으로 설정 파일을 추가합니다.\n<code class=\"language-text\">bootstrap.servers</code>와 <code class=\"language-text\">plugin.path</code> 경로는 상황에 맞게 수정하시면 됩니다.\n추가로 kafka 클러스터를 private network로 연결하고 싶다면 9093 포트를 사용해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Kafka broker IP addresses to connect to\nbootstrap.servers=localhost:9092\n\n# Path to directory containing the connector jar and dependencies\nplugin.path=/home/ec2-user/kafka/plugins\n\n# Converters to use to convert keys and values\nkey.converter=org.apache.kafka.connect.storage.StringConverter\nvalue.converter=org.apache.kafka.connect.storage.StringConverter\n\n# The internal converters Kafka Connect uses for storing offset and configuration data\ninternal.key.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.value.converter=org.apache.kafka.connect.json.JsonConverter\ninternal.key.converter.schemas.enable=false\ninternal.value.converter.schemas.enable=false\noffset.storage.file.filename=/tmp/connect.offsets</code></pre></div>\n<br>\n<p>기존 클러스터에 Authentication credentials, encryption이 설정되어 있다면,\nconnect.properties에 관련 설정을 추가해주셔야 합니다.</p>\n<p>다음 S3에 데이터가 저장될 Bucket을 생성하고, AWS Credentials를 설정합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> awscli\n$ aws configure</code></pre></div>\n<p>sink connector 관련 설정 파일을 <code class=\"language-text\">s3-sink.properties</code>라는 이름으로 config 경로에 추가합니다.\ntopics와 s3.bucket.name의 이름은 맞게 수정해주셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">name=s3-sink\nconnector.class=io.confluent.connect.s3.S3SinkConnector\ntasks.max=1\ntopics=my-topic-name\ns3.region=ap-northeast-2\ns3.bucket.name=my-bucket-name\ns3.compression.type=gzip\ns3.part.size=5242880\nflush.size=3\nstorage.class=io.confluent.connect.s3.storage.S3Storage\nformat.class=io.confluent.connect.s3.format.json.JsonFormat\nschema.generator.class=io.confluent.connect.storage.hive.schema.DefaultSchemaGenerator\npartitioner.class=io.confluent.connect.storage.partitioner.TimeBasedPartitioner\npartition.duration.ms=3600000\npath.format=YYYY-MM-dd\nlocale=KR\ntimezone=UTC\nschema.compatibility=NONE</code></pre></div>\n<br>\n<p>이제 Kafka 설치 경로로 이동하고 Kafka-Connect를 실행시킵니다.\n여기에서는 standalone mode로 실행시켰지만, 경우에 따라 cluster mode로 실행하거나\ndocker container로 실행시켜도 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">./bin/connect-standalone.sh connect.properties s3-sink.properties</code></pre></div>\n<p>이제 지정한 S3 Bucket의 topic/my-topic-name/2018-11-16 경로에 가시면\n지정한 설정 값에 따라 파일이 저장되는 것을 확인하실 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.77825464949929%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAAAkFBMVEXg4ODMzMzu7u7x8fHw8PD29vb+/v749/j39/f19fX09PT29fbe3t7Kysrv7+/z8/Py8vL4+Pj7+/v////9/f38/Pzq7fHp7PHz9ffo7PHp7fHs7Ozt7e329/f5+fn6+vrr6+vq7vHn6OnY2NjU1NTb29va2trf39/c3Nzd3d3n5+fk5OTo6Ojl5eXi4uLm5ubGJdIYAAAACXBIWXMAAAsSAAALEgHS3X78AAAAB3RJTUUH6AEUCgUXJ+suYwAAAOdJREFUKM+NkItOwzAMRU3amLgwZ00cXt3awegYjMf//x3NaKsGTVuPIudaOkqcAFypLNeI19pQtwxRQXTT5SIWMwK3C87YIhLrnI3SS8WKc60Uc8mqKAcAnUMv7hII4e5e8OHxyVario6XrI3RsfSsj42A1LMQaGjJrDaK6SwOmueX7Su0O7go2lk00Lzt2/2ufd9WZ0/sRDMZOX5YXU56MzQOwofzXnrM4fD5ZWUkfP8MCdBPEOsTJFvRXwogccOekGFCyCvbp1QUnYqiqTwt1v9EQ/UghuiNw2eS4Liy42NkFgh+Jr8toi05p/o0ugAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24ANjk562NVBQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMzEzWKsVjgAAABh0RVh0ZXhpZjpTb2Z0d2FyZQBQaG90b1NjYXBldNmbJAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kafka-manager\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=175 175w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=350 350w,\nhttps://images.ctfassets.net/tushy4jlcik7/7Bd9ckjAuOjcObPx6w5uOm/3249660013d289864e8f6469f3086303/kafka-manager.png?w=699 699w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이미 Yahoo의 kafka-manager를 사용하고 계신 분들은 consumers 메뉴로 가시면\ntopic 마다 lag도 모니터링할 수 있습니다.</p>\n<br>\n<h2 id=\"kafka-connect-s3-configuration\" style=\"position:relative;\"><a href=\"#kafka-connect-s3-configuration\" aria-label=\"kafka connect s3 configuration permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Kafka-Connect-S3 Configuration</h2>\n<p>데이터 인프라에 맞게 수정해야할 옵션은 아래와 같습니다.</p>\n<ul>\n<li><strong>s3.part.size</strong>: S3의 multi part upload 사이즈를 지정</li>\n<li><strong>flush.size</strong>: file commit 시 저장할 record의 수 (파일 사이즈와 연관)</li>\n<li><strong>partitioner.class</strong>: partition 기준을 지정 (TimeBasedPartitioner는 시간을 기준으로 파티셔닝)</li>\n</ul>\n<p>이외에도 Avro Format과 Schema Registry를 사용하신다면 <code class=\"language-text\">format.class</code>, <code class=\"language-text\">schema.generator.class</code>를 수정해야 합니다.\n더 자세한 내용은 <a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/configuration_options.html#s3-configuration-options\">공식문서</a>에서 확인하시면 됩니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>사실 Kafka는 이미 대부분의 데이터 파이프라인에서 활용하고 있다는 것이 강점이라고 생각합니다.\nETL 과정이 다양하고 복잡할 수록 새로운 프레임워크가 추가되고 아키텍쳐가 복잡해지기 마련인데,\nKafka의 다양한 컴포넌트들을 잘 활용하면 아키텍쳐를 단순화시킬 수도 있습니다.</p>\n<ul>\n<li><a href=\"https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained\">https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained</a></li>\n<li><a href=\"https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html\">https://docs.confluent.io/5.0.0/connect/kafka-connect-s3/index.html</a></li>\n</ul>","excerpt":"Kafka에는 정말 유용한 컴포넌트들이 존재합니다.\n오늘은 그 중 하나인 Kafka-Connect에 대해 알아보고,\nConfluent…"}}},{"id":"b68b3f15-e560-5485-9b60-204947689edd","title":"Jupyter에서 Scala로 Spark 사용하는 방법","slug":"jupyter-spark","publishDate":"March 22, 2017","publishDateISO":"2017-03-22","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>이 글은 평소에 <strong>Jupyter Notebook</strong> 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook을 설정하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">이전 포스팅</a>을 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"apache-toree\" style=\"position:relative;\"><a href=\"#apache-toree\" aria-label=\"apache toree permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Toree</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.13840830449828%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAACQFBMVEX////+/fr9+u7+/vv89Nv+7LLu3Kjr2qb146z99uP88c7/447dxX3PuHXjy4D99Nn///768M/78Mz78M39+/Lp7/jX5Pbl7ff5+/fY6tTX6dPY6dPX6dLY6dLZ6tT7/fv99d/956P44p79+Of///z86Kn/6qrVxJPUw5LZx5T69ePR3/G80vO5z++brMedr8m4ze7O3fTs8unB4LWowp6fuJepw5+hupinwZ3A4LT2+vX+/v7+/v/j4+T//vz84Y/QunvKtXjPuXr43Yvs5c6vwdmiwOuCmLuIn8Kfvee3zOnO1cqv2put15qbwIqUtoScwYyv2Zv2+vTm7vjI2vTH2vTI2vXs8fn///353YT72nf723f723n89uLF1u6Nr+G6zuvy+O+j04qh0oag0oWl1IzZ5fWqxu6YsNN+k7Gfud6qxu3i6/fa2trZ5PSXt+WXtuSVtOGXt+SYt+Xj6/b57+/ws7Hmrarkq6nfp6Xqr6379vXq6ur46+rpiITaf3vJdHHQeXXOd3Tbf3v79PTu9evW6dHM38fy9/Dw8PDg79m63ayrzJ6du5Gx1KTn8uLv7+/p6en9/f3a7NCk1YqezoWTwH2fz4ak1Yvi8dr4+Pjz8/PS0tL5+fnc3Nzn5+f8/fzw9+zw9+3l7OH9/v3j4+PNzc3CwsLExMTT09Pm5ubBwcHFxcXl5eX67e311tXhwsD68fHb29vGxsa+vr7AwMDHx8ff39/e3t700M/YgX3OfHjTfnrRfXrdhYH229plFnZuAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUZwFMDZAAAAPZJREFUGBmtwbEuBFEYgNHvu/7dWLIyCVF4D4WoPINGr6aTkCgUNlqhWy9ArfIAEoWHoFOOKBRrMu4d2WIRlXNEyWz4WzBn1sQ7fwv6Zk28V0pmRmGB2TNZsCq2pNcVi4aw89Fz6pkseNrUtr1nzcd19WFDUZvwy6RPIduKeLOjAmYUZtiSbl/IgmU7XFNR1ExVNXuXVDVFMG8HqJlxYHaYPnojsuACjk/5xbydSZ9CRmJLOuSHCo7OoKYIemZN8N05mSeg+0AwsMOMsdhC2h3LnFek3WCotiRmLCqoLCphEwRLYktixlDfYkEZ6hsDE3JnZ4t/8gm5JTLML2gYAQAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-toree\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=723 723w,\nhttps://images.ctfassets.net/tushy4jlcik7/3LF9xdwFtjqVq8aro1gys4/9b58362b964797389196beb775221cc8/jupyter-toree.png?w=1445 1445w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><strong>Apache Toree</strong> 는 Jupyter 커널을 통해 Spark에 접속하도록 해주는 아파치 오픈소스 프로젝트입니다.\n기존의 IPython Notebook은 파이썬에 제한되어 있었지만\nJupyter Kernel을 통해 다른 언어까지 확장 가능하도록 바뀌었습니다 (왼쪽 그림 참조).</p>\n<p>여기에서 더 나아가 Apache Toree는 <strong>Toree Kernel</strong> 을 통해 바로 Spark Driver에 연결함으로써,\nJupyter에서 Scala 언어로 Spark Driver/Context를 사용할 수 있게 만들었습니다.</p>\n<p>Toree가 Zeppelin과 다른 점은 <strong>Jupyter protocol</strong> 을 사용할 수 있다는 점 입니다.\n이미 수많은 생태계가 구축되어 있는 Jupyter에서 Spark가 잘 돌아간다면 굳이 Zeppelin을 쓸 필요가 있을까요 (<em>시각화가 어마어마한 강점이긴 합니다</em>).</p>\n<p>GitHub: <a href=\"https://github.com/apache/incubator-toree\">https://github.com/apache/incubator-toree</a></p>\n<br>\n<h2 id=\"jupyter-notebook에-toree-설치하기\" style=\"position:relative;\"><a href=\"#jupyter-notebook%EC%97%90-toree-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"jupyter notebook에 toree 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook에 Toree 설치하기</h2>\n<p>Jupyter 노트북 커널 설정하는 방법은 <a href=\"http://swalloow.github.io/jupyter-notebook-kernel\">Jupyter Notebook 다중커널 설정하기</a>를,\nScala와 Spark을 설치하는 방법은 <a href=\"http://swalloow.github.io/spark-zeppelin-install\">OS X에서 Homebrew로 Spark, Zeppelin 설치하기</a>를 참고하시기 바랍니다.</p>\n<p>Toree는 아직 pre 버전만 존재하기 때문에 <code class=\"language-text\">--pre</code> 옵션을 붙여주시거나 파이썬 패키지를 통해 설치해주시면 됩니다.\n설치가 완료되면 jupyter kernel에 toree kernel을 설치해주는 과정이 필요한데 명령어를 통해 이 과정을 자동으로 진행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ pip <span class=\"token function\">install</span> https://dist.apache.org/repos/dist/dev/incubator/toree/0.2.0/snapshots/dev1/toree-pip/toree-0.2.0.dev1.tar.gz\n$ jupyter toree <span class=\"token function\">install</span></code></pre></div>\n<p>혹시 <code class=\"language-text\">FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/spark/python/lib'</code>\n이런 오류가 난다면, Spark 경로 환경변수를 읽지 못하는 문제입니다. <strong>Homebrew</strong> 를 통해 설치하셨다면 다음과 같이 환경변수를 등록해주시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token builtin class-name\">export</span> <span class=\"token assign-left variable\">SPARK_HOME</span><span class=\"token operator\">=</span>/usr/local/Cellar/apache-spark/2.1.0/libexec</code></pre></div>\n<br>\n<h2 id=\"잘-동작하는지-테스트를-해보자\" style=\"position:relative;\"><a href=\"#%EC%9E%98-%EB%8F%99%EC%9E%91%ED%95%98%EB%8A%94%EC%A7%80-%ED%85%8C%EC%8A%A4%ED%8A%B8%EB%A5%BC-%ED%95%B4%EB%B3%B4%EC%9E%90\" aria-label=\"잘 동작하는지 테스트를 해보자 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잘 동작하는지 테스트를 해보자</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 70.37037037037037%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAcCAMAAAAkyw3kAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAF6UExURfv7+/z8/P////n5+fr6+u/v7+zs7N7d3drZ2uHg4djW1vb3+MPCwa6trrKys8HBwcLCwuvr69nZ2efn5+Hg39bW2NjX2NXV1Pf4+crKyrq6urm4uMnKytLS0v39/fj4+PX19fb29vDw8O7u7u3t7ejo6Pv6+uDf3/T09Obm5+Tj4vLz9OPj48jGxMbGx9TV19fV0sbHyOLi4vLv7sPFyMHAvsLBwtbX2P7+/vLy8v38/PX19urq6vb39+bl5vr5+fX09PHx8sLAvsHCxMfFw8rJyrW4uvHx8f/+/vX08sjJys/Ozs7OzsvMzMzMzP7+/9/f4NfX1tHQ0dzc3N7e3vT19eTj49ra3fb19M/Pz9XV1dXW193e3Ofo6ODg4NrZ2c/Q0O7v7+7u7dnY2NPS087O0P7///Ht7L6+wLOxsL2/v768vc/Q0ejp6/n4+Pz9/ff19M/P0drZ2N/g4O/w8fj29eLh4dTU1N3e3dzb3Ojq6+/w8Obm5unp6WuI8FsAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAABOUlEQVQ4y2NgwAsYmWCAgQkdMLMAAQMrGxAAmXgUsrBzcHJx8/Dy8QsICgnjUygiKiYuISklLSMpKMuKUCgHB/IsYKAAAopKykCgIM+MUKgCB6pMauoamlraCMN1VJBMVIYBFaB7dPX0DQwRCo2UlXAoRAMoCjXgQJDJ2MTUzBxJoaqGBhZfW1gyWVmz2tgiKbREkkZRqGZn7yDviEMhAgDd4+Ts4uqGUKjMwIzdRHSAw2p3RnTgjsuNHhZMIEjYjZ5e3oY+vn7+1HIj0GpZo4BAwaDgkNAwIaNwPFZHREZFx8TGxSckJiWnpIKsZsFuogWzRRqTXBqS1UzYFaZnZGZl5+QSVsiUl4/mGRwKCwqLiuNsSggrLC0rr6isqiakUEkBDShiV8ikIVyDCmqZsSu0wABM2BXiBwCRMkeeP7FP1QAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxN7/zGNAAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-kernel\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=189 189w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=378 378w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Yu7ttVWhrijq7uiNKihXK/e16016b88b72a1084a6e766736037867/toree-kernel.png?w=756 756w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>잘 설치되었다면 <code class=\"language-text\">new</code> 했을 때 <code class=\"language-text\">Apache-Toree Scala</code>가 보이실 겁니다.\n잘 동작하는지 간단한 WordCounter 예제를 실행시켜 보시면 잘 동작하는 것을 확인할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 40.7202216066482%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAQCAMAAABTCc2fAAAMDmlDQ1BpY2MAAEiJlVcHWFPJFp5bUghJKIEISAm9CdKr1NC7dLARkgChxJAQVOzoooJrF1Gs6CqIbS2ArBW7sijY64KIirIurmJD5U0K6PO1753vm3v/e+acM/85d2a+GQDUHDgiUT6qDkCBsEgcHxrISk1LZ5G6AALogApQQONwJaKAuLgoAGX4/c/y7ha0hnLdThbrX/v/q2jw+BIuAEgcxJk8CbcA4sMA4DpckbgIAEIr1JtOKxLJcD/EWmJIEAAiLsPZCqwjw5kKPEZukxjPhtgfADKVwxFnA0CX8WYVc7NhHLqMo4OQJxBCvBFiX24OhwfxA4jHFBRMhViNDLFV5ndxsv8pZuZITA4newQrcpELOUggEeVzZvyf5fjfUpAvHR7DBDZqjjgsXpYzrFtt3tRIGaZCfEyYGRMLsSbEFwU8ub0M38uRhiUp7fu4EjasGWAC+KN5nKBIiPUhZkrzkgKU2IkjlvtCezRGUBSeqMSZ4qnxyvhosTA/JkoZZ3EOP3wYb+ZLghOGbbIEIeEQw5mGHi7JSUxR8ETPFguSYyCmQ3xNkpcQqfR9VJLDjhm2EUvjZZzNIH6bJQ6JV9hgOgWS4bwwey5HPhacC5h/UU5imMIXS+VLUqOGOfD4QcEKDhiPL0xScsPg7AqMV/qWifLjlPbYZn5+aLyiztgBSXHCsG9HEZxgijpgj3M5EXHKsd6JiuISFdxwFEQBNggCLCCFLRNMBblA0NbX2Ae/FD0hgAPEIBvwgZ1SM+yRIu8RwmcCKAF/QsQHkhG/QHkvHxRD/ZcRreJpB7LkvcVyjzzwFOICXA/3xb3xKPj0h80J98A9h/1YasOjEoOJQcQwYgjReoQHF7LOh00MBP9GFwnffJidjItwOIdv8QhPCe2Ex4SbhE7CXZAMnsijKK2mCErFPzBngWjQCaOFKLPLhDF7h21wC8jaFQ/EfSB/yB1n4nrADneBmQTgfjA3V6j9nqF0hNu3Wv44noz19/ko9XQbuquSRebIn2GPWP0Yhf1djXjwHfmjJbYYO4RdwE5jl7BjWCNgYSexJqwVOy7DIzPhiXwmDI8WL+eWB+MIhm0c6h16HT7/MDZHOb6sXpIi/vQi2WJgTxXNEAuyc4pYAXA35rPChVz7MSwnB0d3AGR7u2LreMOU79kI8/I33QJo4UsaGho68U0X+QcAh7oAoDz4prM8BZcrXCsXV3Ol4mKFTrYdAwKgADW4KnSBITAFVjAfJ+AGvIE/CAYRIBYkgjQwGVY8BxRAztPALDAflIEKsAKsBRvAFrAd1IK94CBoBMfAaXAeXAHXwE1wH86LHvAS9IN3YBBBEBJCQxiILmKEmCO2iBPigfgiwUgUEo+kIRlINiJEpMgsZAFSgaxCNiDbkDrkV+Qochq5hLQjd5EupBf5G/mEYigV1UINUAt0LOqBBqCRaCI6Cc1GC9ESdCG6DK1Ca9A9aAN6Gr2C3kQ70ZfoAAYwVYyJGWN2mAfGxmKxdCwLE2NzsHKsEqvB9mHN8D9fxzqxPuwjTsQZOAu3g3MzDE/CuXghPgdfim/Aa/EG/Cx+He/C+/GvBBpBn2BL8CKEE1IJ2YRphDJCJWEn4QjhHFw3PYR3RCKRSbQkusN1mUbMJc4kLiVuIu4nniK2E7uJAyQSSZdkS/IhxZI4pCJSGWk9aQ/pJKmD1EP6QFYlG5GdyCHkdLKQXEquJO8mnyB3kJ+RB1XUVcxVvFRiVXgqM1SWq+xQaVa5qtKjMkjRoFhSfCiJlFzKfEoVZR/lHOUB5Y2qqqqJqqfqeFWB6jzVKtUDqhdVu1Q/UjWpNlQ2dSJVSl1G3UU9Rb1LfUOj0Sxo/rR0WhFtGa2Odob2iPaBzqDb08PpPPpcejW9gd5Bf6WmomauFqA2Wa1ErVLtkNpVtT51FXULdbY6R32OerX6UfXb6gMaDA1HjViNAo2lGrs1Lmk81yRpWmgGa/I0F2pu1zyj2c3AGKYMNoPLWMDYwTjH6NEiallqhWvlalVo7dVq0+rX1tR20U7Wnq5drX1cu5OJMS2Y4cx85nLmQeYt5qdRBqMCRvFHLRm1b1THqPc6o3X8dfg65Tr7dW7qfNJl6Qbr5umu1G3UfaiH69nojdebprdZ75xe32it0d6juaPLRx8cfU8f1bfRj9efqb9dv1V/wMDQINRAZLDe4IxBnyHT0N8w13CN4QnDXiOGka+RwGiN0UmjFyxtVgArn1XFOsvqN9Y3DjOWGm8zbjMeNLE0STIpNdlv8tCUYuphmmW6xrTFtN/MyCzabJZZvdk9cxVzD/Mc83XmF8zfW1hapFgssmi0eG6pYxluWWJZb/nAimblZ1VoVWN1w5po7WGdZ73J+poNauNqk2NTbXPVFrV1sxXYbrJtH0MY4zlGOKZmzG07ql2AXbFdvV2XPdM+yr7UvtH+1VizseljV469MParg6tDvsMOh/uOmo4RjqWOzY5/O9k4cZ2qnW4405xDnOc6Nzm/drF14btsdrnjynCNdl3k2uL6xc3dTey2z63X3cw9w32j+20PLY84j6UeFz0JnoGecz2PeX70cvMq8jro9Ze3nXee927v5+Msx/HH7RjX7WPiw/HZ5tPpy/LN8N3q2+ln7Mfxq/F77G/qz/Pf6f8swDogN2BPwKtAh0Bx4JHA92wv9mz2qSAsKDSoPKgtWDM4KXhD8KMQk5DskPqQ/lDX0Jmhp8IIYZFhK8NuhxuEc8Prwvsj3CNmR5yNpEYmRG6IfBxlEyWOao5GoyOiV0c/iDGPEcY0xoLY8NjVsQ/jLOMK434bTxwfN756/NN4x/hZ8RcSGAlTEnYnvEsMTFyeeD/JKkma1JKsljwxuS75fUpQyqqUztSxqbNTr6TppQnSmtJJ6cnpO9MHJgRPWDuhZ6LrxLKJtyZZTpo+6dJkvcn5k49PUZvCmXIog5CRkrE74zMnllPDGcgMz9yY2c9lc9dxX/L8eWt4vXwf/ir+syyfrFVZz7N9sldn9+b45VTm9AnYgg2C17lhuVty3+fF5u3KG8pPyd9fQC7IKDgq1BTmCc9ONZw6fWq7yFZUJuos9CpcW9gvjhTvlCCSSZKmIi14zGmVWkl/knYV+xZXF3+Yljzt0HSN6cLprTNsZiyZ8awkpOSXmfhM7syWWcaz5s/qmh0we9scZE7mnJa5pnMXzu2ZFzqvdj5lft7830sdSleVvl2QsqB5ocHCeQu7fwr9qb6MXiYuu73Ie9GWxfhiweK2Jc5L1i/5Ws4rv1zhUFFZ8Xkpd+nlnx1/rvp5aFnWsrblbss3ryCuEK64tdJvZe0qjVUlq7pXR69uWMNaU77m7dopay9VulRuWUdZJ13XWRVV1bTebP2K9Z835Gy4WR1YvX+j/sYlG99v4m3q2Oy/ed8Wgy0VWz5tFWy9sy10W0ONRU3lduL24u1PdyTvuPCLxy91O/V2Vuz8sku4q7M2vvZsnXtd3W793cvr0Xppfe+eiXuu7Q3a27TPbt+2/cz9FQfAAemBF79m/HrrYOTBlkMeh/YdNj+88QjjSHkD0jCjob8xp7GzKa2p/WjE0ZZm7+Yjv9n/tuuY8bHq49rHl5+gnFh4YuhkycmBU6JTfaezT3e3TGm5fyb1zI2z48+2nYs8d/F8yPkzFwIunLzoc/HYJa9LRy97XG684nalodW19cjvrr8faXNra7jqfrXpmue15vZx7Sc6/DpOXw+6fv5G+I0rN2Nutt9KunXn9sTbnXd4d57fzb/7+l7xvcH78x4QHpQ/VH9Y+Uj/Uc0f1n/s73TrPN4V1NX6OOHx/W5u98snkiefexY+pT2tfGb0rO650/NjvSG9115MeNHzUvRysK/sT40/N76yenX4L/+/WvtT+3tei18P/b30je6bXW9d3rYMxA08elfwbvB9+QfdD7UfPT5e+JTy6dngtM+kz1VfrL80f438+mCoYGhIxBFz5EcBDDY0KwuAv3cBQEsDgHENnh/oiruXXBDFfVGOwH/CivuZXNwA2DsPgHjY2PDscQA2C4hp/gDIjt6J/gB1dh5pSpFkOTspYlHhDYbwYWjojQEApGYAvoiHhgY3DQ192QHJ3gXgVKHizicTIjzfb3WRoQ6m6AP4Qf4B60NuWT3xqEkAAAHFUExURf////j4+Pr6+vv7+/f39/7+/rq5uZKRkaamprCvr6urrKSioqemqJmanNnY2ff3+vX1+u7v9vP1+eDp39rm2ujn9tzc9uPj9u/m9uDf4OHg4OTi4+3d3e7h4fHq6uzb2+/j4+/i4/Lx8e7f3/Py8u7g4O/j5O3u7vX19fr7/fb3+vn5/Nzd29HY0sfH0MfH1NDQ19rb28nJytXV1dLMzevk5fXy8vTv7/Tt7fXx8fLy8/Ps7PTu7vLy8vXw8PXv8Pbz8/Pz897e3szMzMrKytHR0tva2tDQ0ezh9e3m8tPT09bW19LS0tra297d3vHm5uzV1evi4+bm59rZ2cvKytPU1MrJye3l9vHo+NLR0tjc2Nzd3e/v7/b29svMzNDQ0MXFxsvKy9bW1ufj7eTm5PP09N7d3crJysneycfdx+bm5c/Pz9PT1NnZ2dHQ0dzb3PDn+Ozj8d7e3+Tk+ebm+OHh7ODf39bV1dHS09fW1tjY2Ofk5e/e3urm5v318/zy8fzy8P339u7u7uTj5Onp6u3t7fT09fz8/P349vzz8f329erp6NDQ0t3d3ejn6Pn5+evq6tvb3O7u7+rq6tXW1t3c3PPz9K5amTEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRnAUwNkAAAAv0lEQVQYGaXBoU7DUABA0Xvb15LNEOwSLCkCjUOh8eMjSFA4LJYgsMih9wsTEP6AYBB8wdTWsULegxGypQ0J55CYkQcoaCdR6bcp/ybbbqq1aPJZb970lSQwwB8fmckyLMp6y2VT6oREomrgmjFrAsmOyXuh98MRQzZIVE2P/XJHC4mqo7fd0akri+cD9fGBXySqTrS+oUsgyZ8O5xd6RSu5dIUugf6sZ3JOF4muX/Y8o1NGlO+H11v+oAAKOn0CyKkkKAYIiQIAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMTe/8xjQAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"toree-tuto\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=361 361w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=722 722w,\nhttps://images.ctfassets.net/tushy4jlcik7/7MlTiTNVASSiOjYSjdoy7o/136d6c13106f3dfbadee25f165d8ab62/toree-tuto.png?w=1444 1444w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"docker를-통해-jupyter-설정하는-방법\" style=\"position:relative;\"><a href=\"#docker%EB%A5%BC-%ED%86%B5%ED%95%B4-jupyter-%EC%84%A4%EC%A0%95%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"docker를 통해 jupyter 설정하는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Docker를 통해 Jupyter 설정하는 방법</h2>\n<p>나는 이 모든 것이 귀찮다! 라면 Docker를 통해 노트북을 실행키는 방법이 있습니다.</p>\n<p><a href=\"https://hub.docker.com/r/jupyter/all-spark-notebook/\">https://hub.docker.com/r/jupyter/all-spark-notebook/</a></p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ <span class=\"token function\">docker</span> pull jupyter/all-spark-notebook\n$ <span class=\"token function\">docker</span> run <span class=\"token parameter variable\">-it</span> <span class=\"token parameter variable\">--rm</span> <span class=\"token parameter variable\">-p</span> <span class=\"token number\">8888</span>:8888 jupyter/all-spark-notebook</code></pre></div>\n<p>실행 후 8888번 포트로 접속하면 노트북을 실행할 수 있습니다.</p>\n<br>","excerpt":"이 글은 평소에 Jupyter Notebook 에 익숙해져있는 분들께 유용할 듯 합니다.\nZeppelin Notebook…"}}},{"id":"4324a369-91a5-5afa-bd6c-f65af537b7d9","title":"Raft consensus algorithm","slug":"raft-consensus","publishDate":"September 01, 2018","publishDateISO":"2018-09-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos가 있고, Zookeeper에서 사용하는 Zab이 있습니다.\nRaft는 이해하기 어려운 기존의 알고리즘과 달리 쉽게 이해하고 구현하기 위해 설계되었습니다.\n(PS. 이 글은 블록체인에서의 Consensus 알고리즘을 말하는 것이 아닙니다)</p>\n<br>\n<h2 id=\"what-is-consensus-problem\" style=\"position:relative;\"><a href=\"#what-is-consensus-problem\" aria-label=\"what is consensus problem permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>What is consensus problem</h2>\n<p>하나의 클라이언트와 서버가 있고 클라이언트가 서버에게 데이터를 전달한다고 가정해보겠습니다.\n서버는 하나의 노드로 이루어져있기 때문에 합의가 이루어지는건 아주 쉬운 문제입니다.\n(여기에서 말하는 합의는 공유된 상태라고 이해하시면 됩니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.470588235294116%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAQVQTFRF////7e3u4OHh3d3d8PHy9vb25uXl3d3f3Nzd8/Pz5+fo+vr69PT05Orv/Pz8/f3+e5/CU4Kwg6XG4+vy7vL3+/z9cpm+ep7C/v7/+vv93ufw/f79ocKXh7F65u7juNGxRIUwXpdObJ9dtc+tSIg1WpNIaJ1Z/P37lruLfKpu4Ovd+vv8i6rKaZK6xdXkvc/haJG6ka/M/P3+xtXlW4i0i6vKZ5G5XYm10N3p3efwWIaygaPFdpzAV4Wy5u3z1+Lst8ve9Pf68fT4tsrd2+Xu397g4N/f19fX7uzs+fr78fHv2dna19bW9PT17Ozt29ra4eHh2tna/v796Onp6Ojo3N3d29vbtUYrmAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAACXSURBVCjPY2AgEjDiEgeB30gCLDgUspKiEEUAl0IWoMJ3yAJMOBUy/BchRiETKwMbCzG+ZpBk/P2aYXAAiBulgYHxCL9CFnioMdBbIYa8NlDPJQRXH8g9hzWuOVAN57jFoI49CtnYfrAipyIGHTbsCo+zCrMh6zNiP0ROgCMBV1DS3g7jeYF4m7B6hosR2TdA3rZ/pFkNAAnqEXVHLdrRAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-con1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=340 340w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=680 680w,\nhttps://images.ctfassets.net/tushy4jlcik7/6BBYzQoA7P1pD2v5vifjDA/feea5cc2b82e09a626440e4ef5850866/con1.png?w=1360 1360w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만일 위 그림처럼 여러 노드로 이루어진 분산 서버에서 합의를 이루어내야한다면 어떻게 해야할까요?\n이러한 문제를 <strong>distributed consensus problem</strong> 이라고 합니다.</p>\n<br>\n<h2 id=\"raft-algorithm\" style=\"position:relative;\"><a href=\"#raft-algorithm\" aria-label=\"raft algorithm permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Raft Algorithm</h2>\n<p>Raft의 node는 <strong>Follower, Candidate, Leader</strong>라는 3가지 state를 가집니다.\n모든 노드는 처음에 Follower state를 가지고 시작합니다.\n만일 Follower가 Leader의 응답을 받지 못하면 Candidate 상태로 전환될 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.13274336283185%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACIlBMVEX////4+Pje39/i4uP69/bu29P//v75+fq8vsPx8fH9rIzziF/9w6z19fWHlLBsepyAiZ37+/v6nnr4spf29vb9/f38/Pzf399zgqV5iq9zfpn39/fu7u7w4dz0x7bv6OWprLOJkqW9v8Pv7+/z8/PX5+L09PTO5N3o6Ojs7Oz+y7fbn4ne2tnw8PCj18fw5N/zspjVsaLj4+Py8vLt7e7p6enM0+WnsMTL2NW93tTb6OSlysK5w9q4vsrr6+vv2dH6jGHthFznvq/+/v72t57rg1v4jGLIxsbz8/Tm5uazt7+ImsWElr+ts8OXo7t/kLiMnsnCwsLx8fL/+ff9oX76lnDw4Nnv0MP1j2X9spXe3+KJmb+ImsK/wsqqsL6ImsSOnLzV5uDN49zl6+nD4Nfl5ebT1NXN6uDOz9Dr7ezI4trZ7ufV7ubp7uzk9O+43dHp7Ovd6eXo8u7Y6OP5+fnX5+Ha6OPv7ezhysHg3t3o6uy1ucHi4uLu7u+/ztC41Mvr7O2htrXZ4t/8tJnziF7zrpLR5d+VpMd6irCIkKK4xN+HmcORnLft7e3o7Ovg6ueZpcN7jLGKkJ39rI30iF/zqIe+39TKyst5ia9ndZWFjqWquNmBkrqJl7je6ebB39Xh4uN6iKhndJSDjKLv7u7f1tP+1MT/9vL6+vq4u8Gdo7O2trf29vfKzNKrs8bW2d2tsLiTm62ysrT3+Pj39vbl5eWJXjqHAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAYlJREFUKM9jYIABRiYGDMDIjCnGwMLKhiHGzsGJqZCLmwddiJePXwBdTJBXiFtYRBRFTExcQlJKGlWMV0ZGVk5eRkYaSUxERkZBUUlGmRFJTEUGBFRlkFWqqctAAVSlhqaWto6MjK6ujJ6yjIy+gaGRMYOJqZm5haWMsjIIWVnb2JqqMTDY2Ts4OsnIMDjrMgjKyLi4url7MHh6efv4wsX8/AMCg4BGBoeEhsEFwyMiQdZERcfEwsXi4hOMIT6WkUlMggomp0AclJomA1GYLiOjmaELDQYZmcwsqEKgLEwMojAbIcbgrCwDt0bGGFksJ5chL19GBh49aqBwkVZm5EWEBVCsoJCxqLhEpLSwDB5mouUVleAQq6qugYvV1tWDxRoam5zhgdvc0toGEmzv6ISLdXX39Mr09ctMmDgJETOTp0ydBlQ3fcbMWXCx2XPmasrMm79g4aLFcLElS5ctd15RIui8ctXqNVAx5bXr1ouWMK5w3rBx02aYwi26cD0agrAkYQoX21oCJABCrFltDlACBwAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-election\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=452 452w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=904 904w,\nhttps://images.ctfassets.net/tushy4jlcik7/6KdskE02jZvwEPZbX0i9Uf/07a3547b540183a976b07860977c7cd2/election.png?w=1808 1808w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Candidate는 다른 노드들에게 투표를 요청하고 노드들은 투표 결과를 응답으로 전달합니다.\n노드 중 가장 많은 표를 얻은 노드는 Leader가 될 수 있습니다.\n이러한 프로세스를 <strong>Leader Election</strong> 이라고 부릅니다.</p>\n<br>\n<h2 id=\"leader-election\" style=\"position:relative;\"><a href=\"#leader-election\" aria-label=\"leader election permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Leader Election</h2>\n<p>Raft는 투표를 관리하기 위해 두 가지 timeout 설정을 가지고 있습니다.\n첫 번째는 <strong>Election timeout</strong> 입니다.\nElection timeout 이란, Follower에서 Candidate로 전환되기 위해 기다리는 시간을 의미합니다.\n일반적으로 Election timeout은 150ms에서 300ms 사이의 값으로 랜덤하게 설정됩니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.60085836909871%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAABU1BMVEX////m5ufi4uPu7u75+fnV1dbc3N3q6urm5ebn5+jz8/T6+vr08/Po6OjZ2Nnk5OTn5+fy8vL7/PzP3+x+qcvl7fTY5e+mw9vw9fmRtdNFgrSnxNtpmsKevtj5+/zO3uv5+/2zzOBuncTa5vDw9/Du9u6lwtuErM32+fve5OlWhKl4mbT+/v6kucqXrsH3+Pjp8PacvNfV4+5unsXX5O+tvcpDeqfv8PDj5eZDfq9OiLi5xtHt9u3x+PGWudVvnsX4+vzb5/D5+vucssPAzdiDoblvlLLs7e93o8jA1eb//v7q6uvw7/D19PXy8fDt7e319fb8/Pz9/f37+/v+/v319fXf39/j4+Pc3Nz09fXu7e3V1dXk5eXZ2NjT09Px8PD8/f7w8PDq6enw8PH39/bp6enn5ufp6Onj4+Tp6ej29vb7+vri4uLl5eXm5ub39/fx8fEBy5e1AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAANBJREFUKM9jYCAVMDIxowuxsLKxYyrk4OTiRhXh4eXjFxAUQlcoLCKKoVlMXALTREkpaQwxGSlZTIVy8goYYopKykT5T0WVYegBNXUNKEtTSxvC0NHV04eKGRgawRQaS5lAWaZSZuZghoWllTWYYWNrJ2UPU+jgCGM5ObtATXR1c4eKKXt4Qlle3j6+UKaff0AgmBEUpBMIFQsOCYayQsPCYQmHPyIyEsyIio6JgorFxsUnoHmKWyAxyTs5BchKTUvPyMwCiWUL5OTm5ReQEDQAk9obzcWlL8QAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-timeout\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=466 466w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=932 932w,\nhttps://images.ctfassets.net/tushy4jlcik7/1lnUXE8cPw3uUJ8ZFVMjDv/287c2b6fb8bf15530f103bb7a46a7309/timeout.png?w=1864 1864w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>Election timeout이 끝나면 Follower는 Candidate가 되고 Election term을 시작합니다.</li>\n<li>Candidate는 본인에게 투표를 하고 다른 노드들에게 투표 요청 메세지를 전달합니다.</li>\n<li>만일 메세지를 받는 노드가 해당 Election term에서 아직 투표를 하지 않았다면, 먼저 메세지를 전달해준 Candidate에게 투표합니다.</li>\n<li>투표를 마친 해당 노드는 Election timeout이 초기화 됩니다.</li>\n<li>가장 많은 표를 받은 노드가 Leader로 선정됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.4968152866242%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABU1BMVEX////7+/ri4+To6Ont7e329/f4+Pn5+vn29vbp6enZ2dre3t739/f9/f3T0tPU1NX8/Pz19fXp7fDr8PP19vb4+Pjc3d+To7Df4eJtncRPiLjA1eZlhJ5FgrRph6B0osdGgrTH2eiDl6Y9c5+Imqn5+/3o7/b+/v7k5OT/8fH/9vb/9fX/8vL/+fn/p6f/kJD/qKj/o6P/lZXn5+fe1NT/i4z4+vzl7fRDcZdAdaDN0NP/tragv9lXjru0zeGdnZ2AgIDR0dG4z+KYutbd3d0/daJDfa68wcX/i4v/6uqMstGXudWjo6PX19fB1eZ9qMvEyc21vMH3+vzK2+nw8PDo8Pb7/P319PTj4eLw8PHk4+T08/T9/fzi4eLo6Ojq6eni4uLx8fH+///y8vLk5OX39/bh4uL+/f3r6uv7+/vg4OD5+fnl5eXr7Ozz8vLr6+v09PUQ6ejaAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAOtJREFUGBnFwcdWwkAAQNGHBCUCCir22FEUO/aKvfcogr1gw/b/K89kgp5MNrryXv7MU+TVUPmKS1D49dKAFsQpVFbuRRGOVFRWRVFU19TiUlffgKrRaMKluaUVVVt7By6xTly64vyL7h6ERC8/+vpxGxhEGBrmW3JkFNsYtmCcgnFs+sTk1HQCYWZ2Dmk+tYC0aCwhLa+srq1vIGwaW0jbqR2kXWMP2/4BtsOjGFLYpOD4BCl9mjGRsvEzLOcXlybS1fXNLZa7ezOHEPI8ZH2PCJHkUw7L80vAzOCU11/Tb+9RHPIfmv+T3/sC5fod0nl6MhkAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-reelection\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=471 471w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=942 942w,\nhttps://images.ctfassets.net/tushy4jlcik7/3yqR3Uoce93mduU0qTC0l0/9549b6a8dd7bf13c645868db4f3bbae3/reelection.png?w=1884 1884w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>선정 이후 Leader는 Append Entries 메세지를 Follower들에게 전송합니다.</li>\n</ol>\n<p>(이 메세지는 <strong>Heartbeat timeout</strong> 에 설정된 간격마다 보내게 됩니다)\n2. Follower들은 Append Entries 메세지를 받으면 Election timeout이 초기화되고 메세지에 대한 응답을 Leader에게 보냅니다.\n3. 만일 Follower에게 Heartbeat가 도달하지 않으면 다시 Election term이 시작되고, Follower는 Candidate 상태로 전환됩니다.\n(위 그림은 노드A가 죽고 난 이후 노드B가 Leader로 선정되고 Heartbeat 메세지를 전달하는 예시입니다)</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 49.6054114994363%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAABxVBMVEX////m5ebh4OHu7e38/Pzm5ubg4eHt7e36+vvf3t/i4uPs7Ozf39/h4eLr6urj4+Pk5OT4+Pjy8/Py8vLz8/Ps7Ovg4ODc3Nzn5+f7+/v7+vro5+f6+/vy8fLp6enw8PDn5+jo6Ojv7+/29fXx8PDo5+ju7+/19vb39/e/xszw8fH6+vrv7/C/xsvw8PHEz9hokbKOprrFz9hqjqxKhbaJo7il0qbx+PHg8OG227drj62HoriEpL1FgrRGeaKGpb5kjrCAnreGw4fq9OrT6dOdzp1mj7F+nbfV2992mriuvszW2+CtvszW4dscdTjy9PWo06jy+PLh8OK43LnY4t0adDby8/Xa7NqEwYTp9OnS6NKbzZvZ7NpyuXPm8uZ0uXXk8uX9/v709/rZ5vBGiZ2lxNba5vBGip2jw9WcvNdVjbvZ5fC4z+LY5e+VuNRYjruWudVWjbupxdzH2umqxt3G2eji6/N/qcu80uTj7PR/qcy70ePu9Pj+/v79/f3p5+jr6+z09PTq6+v39vba2drU1NTz9PXa2trx8fH29vb19fTe3d3d3d78/f319fXd3d3y8vH7/Pzl5ebx8vLl5eXl5OTu7u6DUbJjAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAATNJREFUKM9jYKAUMDIxs4AZrGzsHFAxFk4ubgiDh5cPppBfQFAIxhCGCImIiolLSEoBGdxi4tKSMiAxWTl5BUUlZQYGYTkVCVU1dbBCDWE1TS1JbRBDR1cPxAABfQNDCMMIxgACYxNTM3MGBgtLKxNrmJiNrZ0kmGFva6cNE3SwdXRyZmBwcXWzdYeJeXh6QRjenj5wE339/AMCGRiCgkNCw/CHRThDRCQDQ1Q0QwzDYACxcVBGfAJcLDEJncHAkJySCmGkpWfABTOzsiGMnKxcmFiebT6EUWBbCFdYZFsMYZTYlsLEysorIIzKqmqEe2owGAwstSwwRl0tTLC+oRHCkGtqhom1tKq0gRntrR2dULGu7h6VXhCjr6d/wkSwkOCk9n6BycDEJzilvX9qxzRaBCsAGto4F9TOqwwAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=444 444w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=887 887w,\nhttps://images.ctfassets.net/tushy4jlcik7/1WStOivcFzgXTGyKIUnfVq/bafd938d4afdc5627df24dbc22821d6e/same1.png?w=1774 1774w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>만일 두 개의 노드가 동시에 Election term을 시작하고 메세지가 동시에 Follower에게 도달한다고 가정해보겠습니다.</li>\n<li>이러한 경우 노드A, 노드B는 2표씩 얻게 되고, 표가 동일하므로 해당 Election term에는 Leader가 선정되지 않습니다.</li>\n<li>Leader가 선정되지 않았으므로 Election timeout에 따라 새로운 Election term을 시작하게 됩니다.</li>\n</ol>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.112866817155755%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAMAAADImI+JAAAB1FBMVEX////29fbz8/T7+/v5+vr29vbz9PT5+fj5+fn4+Pj6+vnf3d3X1tfr6+vr7Ozf39/W1tfs6+v8/PzV09PW1tbU1NTV1tbr6ur39/fm5ebt7e3n5+fl5eXx8fH4+Pfl5ebo6Ofr7O3u7e7n5ubn5+jg4ODk4+P09PTu7u7j4+Tz8/Px8/SJpLqmusr9/f3z9Palucnb4eePqb7X3uTd4+iPqb/V3OOoushIhLVckLvX292svMpfkrzU2Ntoj65hlb+IorhylbOHobjg5upUgaZska/29vfi5+tVgqdpj6719fWjt8eBo7+gtMSmucmdssP29/fv9+71+vXv9+/0+fT4+/j9/v33+vybvNfQ4Oz4+vzA1Obr8veyy+D6/P3k7fSxy+D5+/280uRFgrTA1ebo7/auyN6pxdx/qculw9vs8vdvnsWGrs79/v7u8/hwn8WErM39/f7h6/Pe6fK3zuJ/qczc6PHi4eHd3N3v7u3w8fLj4+Lc3d3u7u/y8vPe3d7h4eLv7+/+/f3e3t7y8vL//v7s7Ozd3d3i4uTs7e3f3t7g4OHj4uLt7Oz39vbw8PHV1NPz9PPw8PDU1NXq6uv6+vr6+fn6+fr6+/v19PX09fX39/hO+TawAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCgUXJ+suYwAAAURJREFUKM9jYCAFMDIxs4AZrGzsHFAxTmZmGIMLrpCbh5cPzOAXEOSFCAkJi/CCNQuJiolDNUtISknLSMkyMMjJSylIKsqCxJSUVVTV1IFMDWlpVU0tWaiJ2jq6emCGvo6BEFTM0MgYwjAxNYNbbW5haQVmWFvY2ELF7OwdIAxHeye4QmcXVzcww93D0wsq5u3jC2H4+fjjDwpWGCMASTAwCMoIDsGvOzQMnUEvEB4RCWFERUTDxGJi4yCM+IREuMKk5OQYMCMlOTkVKpaWnA5hZCRnwhVmZefkghl5+QWFULGigmIIo6S0jHQ3lldUVoEZ1TW1dRAhvfqGRrAtTc0NLZCEwNDa1l7e0QlKIG1d3T29WiCxvv4JNbysE4FJa9Lk9ims0FiayjmNk2MqmDEdwmBg9mqZMVOIE8yYOktoNgnOAwBMsz1jWZo4tgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-same2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=443 443w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=886 886w,\nhttps://images.ctfassets.net/tushy4jlcik7/HiBiIl1wDFXfJ0O8WukTX/a76fbf5bc7cad58f95edfd8bbfe7795d/same2.png?w=1772 1772w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"log-replication\" style=\"position:relative;\"><a href=\"#log-replication\" aria-label=\"log replication permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Log Replication</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.56756756756756%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAY9QTFRF////6erq2trb19fY8PDx3N3d5eTk3Nzd3dzc8PHy6+vs9/f38O/v4ODg+fj4/Pz8/f39b3qFPV+ARF54yMnKv7+/S3WeU4KwY3WGw8PDSXKaZXaH/v7+fIWPO1l4S2J40dHS8/Pz7u7u+/v77Nzb+tfV/Obl/Onn//3+7u3t7uzs9vb26/LppcScwte8+/z6UY4/N30is82r5e7igq518Wxk84eA/ODe7UU6+s7LZpxWOn8mx9vB9ZyW96+r/e7t8npy/OLh+vz5yNzD4uzf9fj66/D24erx/v//7vL3ZI64YIu2tMjcrsTaep7C3+jwu83gWIaz/P3+apO7Z5G53efwVYSxV4Wy4+vyj63LjKvK1uHsp7/X2eTu+Pr8s8jcssfc9/n73dvd4+Pj2tna+vr64uLi9vTy3Nvd3Nzb5+fn+fn52NfY4eDg29vc6+vr3d3d3Nvb5ebn8vP09fX15ubn9PT06ejo+Pj46urr2dnZ4eHh6Ojo9vf37e3t4eDh4+Hi5+jo5OTk6urq8/TzqGGxIAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAEHSURBVBgZtcHlUsNAGAXQC5QiKS4fEizFQrHF3d3dvVBoCwQnuD44w480C83QnelwDsIVERlli4YAe0xsXDwESI4EW2ISQktOSU1Lh4CMTKIsCMjOIcqFADkvv6CwSPnmxN+cQHFJaVk5FISkVqiqorjwfyqrqiGippaxOgioZ4w1gNPYBENzSysC5DbW3gFOZxcM3T29MPX1DyBgcAg/DY/AyujY+AR4kzQ1DQszRLNz4MwTLcDC4hItr4CzSrQGK+sbm+Btbe/sIhx77v0DD0yHR16fw49gxyenLg0m7ez8wn+JIFdu77Xv5hYG/U67f5Aen/Db88vrmyJrMOjvds+H/ilB3BfC2iqVNL8AJAAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-message\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=296 296w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=592 592w,\nhttps://images.ctfassets.net/tushy4jlcik7/4kpjxl8foPXqkam5PRhM6m/3bfa22572c60e24690d23bf5df93e67b/message.png?w=1184 1184w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Leader가 선정되고 난 이후, 시스템의 모든 변화는 Leader를 통해 이루어집니다.\n클라이언트는 Leader에게 데이터를 전달하고, Leader는 데이터의 복제하여 Follower에게 전달합니다.\n이 과정은 앞서 언급했던 <strong>Append Entries</strong> 메세지를 통해 이루어집니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.810810810810814%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMImlDQ1BpY2MAAEiJlZcHVJPJFoDnL0lISGiBCEgJvQnSq9TQIghIFWyEJJBQYkwIKnZkUcG1oCKCFVkVUXQtgCwqYi+LYu8LKirKuliwofImCaBPz3vvvHvO/Ply586de+8/M+cfANRjOGJxNqoBQI4oVxIbFsSckJzCJD0ECNAGqoAK1DhcqTgwJiYSQBn6/Xd5dwNaQ7lqL/f1c/9/FU0eX8oFAImBnMaTcnMgHwQAd+eKJbkAEHqg3mxGrhgyEUYJtCUwQMjmcs5Qsqec05QcqbCJj2VBTgVAhcrhSDIAUJPHxczjZkA/assgO4p4QhHkZsh+XAGHB/kz5FE5OdMgq1tDtk77zk/Gv/lMG/bJ4WQMszIXhagEC6XibM6s/7Mc/1tysmVDc5jBRhVIwmPlOcvrljUtQs5UyGdFaVHRkLUgXxPyFPZyfiKQhScM2n/gSlmwZoABAErlcYIjIBtANhVlR0UO6v3ShaFsyLD2aLwwlx2vHIvyJNNiB/2jM/nSkLgh5kgUc8ltimVZCYGDPjcJ+Owhn035gvgkZZzo5TxhYhRkNcj3pFlxEYM2z/MFrKghG4ksVh4zfOcYSJeExiptMPMc6VBemLdAyI4a5MhcQXy4ciw2hctRxKYLOZMvnRA5FCePHxyizAsr4IsSBuPHSsW5QbGD9tXi7JhBe6yZnx0m15tCbpPmxQ2N7c2Fi02ZLw7EuTHxythw7UzO2BhlDLgtiAQsEAyYQAZbGpgGMoGwraehB/5T9oQCDpCADMAH9oOaoRFJih4RfMaBfPA3JD6QDo8LUvTyQR7UfxnWKp/2IF3Rm6cYkQWeQM4BESAb/pcpRomGZ0sEj6FG+NPsXBhrNmzyvp90TPUhHTGEGEwMJ4YSbXB93A/3wSPhMwA2Z9wT9xqK65s94QmhnfCQcJ3QQbg9VVgg+SFyJhgHOmCMoYPZpX2fHW4JvbrhQbgv9A994wxcH9jjrnCmQNwfzu0Gtd/HKhvO+FstB32RHckoeQQ5gGz9YwRqtmpuw17klfq+Fsq40oarxRru+TEP1nf148HfiB8tsSXYAewMdhw7hzVjDYCJHcMasYvYETkPr43HirUxNFusIp4s6Ef403ycwTnlVZM61jp2O34e7AO5/Jm58s3CmiaeJRFmCHKZgfC05jPZIq7DKKazoxM8ReVnv/JoecNQnOkI4/w33SIPeFSSBgYGjn7TRfwFwIFOACj3vumsWuB2hvvn7GquTJKn1OHyBwFQgDrcKXrACJ5d1jAjZ+AOfEAACAFjQTSIB8lgCqyzAK5TCZgB5oCFoAiUgJVgLagAm8E2sBPsAftBA2gGx8FpcAFcBtfBXbhWusAL0AvegX4EQUgIDaEjeogxYoHYIc6IJ+KHhCCRSCySjKQiGYgIkSFzkEVICVKKVCBbkRrkd+Qwchw5h7Qjt5FOpBt5jXxCMZSKaqOGqCU6GvVEA9EINB6djGag09F8tBBdjpajVehutB49jl5Ar6Md6Au0DwOYKsbATDB7zBNjYdFYCpaOSbB5WDFWhlVhdVgTfNNXsQ6sB/uIE3E6zsTt4XoNxxNwLj4dn4cvwyvwnXg9fhK/infivfhXAo1gQLAjeBPYhAmEDMIMQhGhjLCdcIhwCu6dLsI7IpHIIFoRPeDeSyZmEmcTlxE3EvcSW4jtxEfEPhKJpEeyI/mSokkcUi6piLSetJt0jHSF1EX6oKKqYqzirBKqkqIiUilQKVPZpXJU5YrKU5V+sgbZguxNjibzyLPIK8jV5CbyJXIXuZ+iSbGi+FLiKZmUhZRySh3lFOUe5Y2qqqqpqpfqeFWh6gLVctV9qmdVO1U/UrWotlQWdRJVRl1O3UFtod6mvqHRaJa0AFoKLZe2nFZDO0F7QPugRldzUGOr8dTmq1Wq1atdUXupTla3UA9Un6Ker16mfkD9knqPBlnDUoOlwdGYp1GpcVjjpkafJl3TSTNaM0dzmeYuzXOaz7RIWpZaIVo8rUKtbVontB7RMboZnUXn0hfRq+mn6F3aRG0rbbZ2pnaJ9h7tNu1eHS0dV51EnZk6lTpHdDoYGMOSwWZkM1Yw9jNuMD6NMBwROII/YumIuhFXRrzXHakboMvXLdbdq3td95MeUy9EL0tvlV6D3n19XN9Wf7z+DP1N+qf0e0Zqj/QZyR1ZPHL/yDsGqIGtQazBbINtBhcN+gyNDMMMxYbrDU8Y9hgxjAKMMo3WGB016jamG/sZC43XGB8zfs7UYQYys5nlzJPMXhMDk3ATmclWkzaTflMr0wTTAtO9pvfNKGaeZulma8xazXrNjc3Hmc8xrzW/Y0G28LQQWKyzOGPx3tLKMslysWWD5TMrXSu2Vb5VrdU9a5q1v/V06yrrazZEG0+bLJuNNpdtUVs3W4Ftpe0lO9TO3U5ot9GufRRhlNco0aiqUTftqfaB9nn2tfadDgyHSIcChwaHl6PNR6eMXjX6zOivjm6O2Y7VjnedtJzGOhU4NTm9drZ15jpXOl9zobmEusx3aXR55Wrnynfd5HrLje42zm2xW6vbF3cPd4l7nXu3h7lHqscGj5ue2p4xnss8z3oRvIK85ns1e330dvfO9d7v/Y+PvU+Wzy6fZ2OsxvDHVI955Gvqy/Hd6tvhx/RL9dvi1+Fv4s/xr/J/GGAWwAvYHvA00CYwM3B34MsgxyBJ0KGg9yxv1lxWSzAWHBZcHNwWohWSEFIR8iDUNDQjtDa0N8wtbHZYSzghPCJ8VfhNtiGby65h9471GDt37MkIakRcREXEw0jbSElk0zh03Nhxq8fdi7KIEkU1RINodvTq6PsxVjHTY/4YTxwfM75y/JNYp9g5sWfi6HFT43bFvYsPil8RfzfBOkGW0JqonjgpsSbxfVJwUmlSx4TRE+ZOuJCsnyxMbkwhpSSmbE/pmxgyce3Erkluk4om3ZhsNXnm5HNT9KdkTzkyVX0qZ+qBVEJqUuqu1M+caE4Vpy+NnbYhrZfL4q7jvuAF8Nbwuvm+/FL+03Tf9NL0Zxm+GaszugX+gjJBj5AlrBC+ygzP3Jz5Pis6a0fWQHZS9t4clZzUnMMiLVGW6OQ0o2kzp7WL7cRF4o7p3tPXTu+VREi2SxHpZGljrjb8yL4os5b9IuvM88urzPswI3HGgZmaM0UzL86ynbV01tP80PzfZuOzubNb55jMWTinc27g3K3zkHlp81rnm80vnN+1IGzBzoWUhVkL/yxwLCgteLsoaVFToWHhgsJHv4T9UlukViQpurnYZ/HmJfgS4ZK2pS5L1y/9WswrPl/iWFJW8nkZd9n5X51+Lf91YHn68rYV7is2rSSuFK28scp/1c5SzdL80kerx62uX8NcU7zm7dqpa8+VuZZtXkdZJ1vXUR5Z3rjefP3K9Z8rBBXXK4Mq924w2LB0w/uNvI1XNgVsqttsuLlk86ctwi23toZtra+yrCrbRtyWt+1JdWL1md88f6vZrr+9ZPuXHaIdHTtjd56s8aip2WWwa0UtWiur7d49afflPcF7Guvs67buZewt2Qf2yfY9/z319xv7I/a3HvA8UHfQ4uCGQ/RDxfVI/az63gZBQ0djcmP74bGHW5t8mg794fDHjmaT5sojOkdWHKUcLTw6cCz/WF+LuKXneMbxR61TW++emHDi2snxJ9tORZw6ezr09IkzgWeOnfU923zO+9zh857nGy64X6i/6Hbx0J9ufx5qc2+rv+RxqfGy1+Wm9jHtR6/4Xzl+Nfjq6WvsaxeuR11vv5Fw49bNSTc7bvFuPbudffvVnbw7/XcX3CPcK76vcb/sgcGDqr9s/trb4d5xpDO48+LDuId3H3EfvXgsffy5q/AJ7UnZU+OnNc+cnzV3h3Zffj7xedcL8Yv+nqK/Nf/e8NL65cF/Av652Duht+uV5NXA62Vv9N7seOv6trUvpu/Bu5x3/e+LP+h92PnR8+OZT0mfnvbP+Ez6XP7F5kvT14iv9wZyBgbEHAlH8SmAwYampwPwegcAtGQA6Jfh98NE5d1MIYjyPqkg8J9YeX9TiDsAexYAEAsbC3577IPNEjItAAD5J3h8AEBdXIbboEjTXZyVvqjwxkL4MDDwxhAAUhMAXyQDA/0bBwa+VMNgbwPQMl15J5SL/A66xVVOVxjiD+AH+Re66HKb29MDMgAAAWJQTFRF////1dbW2NjZ5+fn3t7f+Pj41tXW4N/e5ebn8fDx/P397Ozsh5Kc6+vrb3+OY423XYm1bn6OXnSKapO7b5a9XXSK09PTZGRk/Pz8wMPFSmWAv8LE8/Pz8PDw9vb2zc3NVFRU+vr619fX2tra7O3u6ejp9fX1/v7+9fn09PjyXZVLOH4jkLeFvtW4N30iOX8l/P386fHnRocycaJi8PXu0eHN/P379vj72ePu5+306O70d53BU4Kw5+70WoezVoSxjKzK/P3+VoSyytjny9nnsMbbXoq1hqfH+fv8/f39+vv9hqfIr8Xa79HQ+9zb/vf2/vT07+np+tfU/Ono/ezr9fT06unq5+bm7ezs+fn56+rp7+7v5eXl9/f38fHx7+/v29ra7Ozr29vb3t7e3Nvb9/f48vPz5eXm4N/f6urp9PX139/f3Nvc8vLz8PDx8O/w/f7+9PT08vHy7e3t8fHy+/v7PYmACgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFyfrLmMAAAD3SURBVCjPY2CgCDAyMbMQo46VjZ2Dk4sYldw8PLxEWc3HLyBIlEIhYRFRgorExCUYJKWkpGVkgUAOj0J5BUUwraSsosogS4T1YBPVyAtedQ3i1GlqaesQpVBXT0/fgBiFhkZ6xsTZbWJqBmOaW6DIWFrh0mNtI2yL4FnZ2TtgV+foZGPjjOC62NjY40hErm7uHqCAlvUE8by83XwUQTwZbGolfP38AxBxFxgUHIIZk6Fh4azcESAzIkHcqOiY2DgQLx5doWoCk1wigpuUnJKahs3W2PQMJV65TBg3KzspJ5cXW0pTzMuXlSkohDukqLgklrWUxJQDAK+hI2NzOnqmAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"raft-res\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=333 333w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=666 666w,\nhttps://images.ctfassets.net/tushy4jlcik7/7d55dhp9iGNA9yCdVHa47M/96613792d4891ade47f0535f52cf3c6d/res.png?w=1332 1332w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Follower는 받은 데이터를 commit 하고 결과를 Leader에게 전달합니다.\nLeader는 Follow로부터 받은 결과를 Client에게 전달합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>정리하자면 분산 시스템은 fault-tolerence를 보장하기 위해 consensus algorithm을 사용하고 있고,\n분산 시스템을 다루는 프레임워크마다 Consensus 구현이 조금씩 다를 수 있습니다.\n그리고 원활한 Leader Election을 위해 클러스터 노드의 개수는 홀수로 구성하는 것이 좋습니다.</p>\n<p>Raft의 경우 Redis cluster에서 응용하여 사용하고 있고,\nElasticsearch cluster 또한 quorum-based consensus algorithm을 사용하고 있습니다.\n아래의 Raft 논문과 시각화 자료 링크를 보시면 더 쉽게 이해할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://raft.github.io/raft.pdf\">https://raft.github.io/raft.pdf</a></li>\n<li><a href=\"http://thesecretlivesofdata.com/raft/\">http://thesecretlivesofdata.com/raft/</a></li>\n<li><a href=\"https://raft.github.io/\">https://raft.github.io/</a></li>\n</ul>\n<br>","excerpt":"Consensus란 분산 시스템에서 노드 간의 상태를 공유하는 알고리즘을 말합니다.\n가장 유명한 알고리즘으로 Paxos…"}}},{"id":"a393498e-de9e-5231-bc9f-fd1df0495f45","title":"Apache Airflow에 기여하면서 배운 점들","slug":"airflow-contrib","publishDate":"December 08, 2018","publishDateISO":"2018-12-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow 프로젝트에 대한 설명은 다른 글에서도 많이 다루기 때문에 생략하고\n이 글에서는 처음으로 아파치 프로젝트에 기여해본 경험을 정리해보려 한다.</p>\n<br>\n<h2 id=\"기여하게-된-배경\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%97%AC%ED%95%98%EA%B2%8C-%EB%90%9C-%EB%B0%B0%EA%B2%BD\" aria-label=\"기여하게 된 배경 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기여하게 된 배경</h2>\n<p>당시에 관리하던 데이터 인프라에는 의존성이 얽혀있는 배치 작업이 상당히 많았다.\n여기에서 의존성이 얽혀있다는 말은 A 작업과 B 작업이 성공적으로 끝나고 난 뒤 C 작업을 해야하는 경우를 말한다.\n또한 각 작업들은 서로 다른 시간에 스케줄링 되어야 했고, 작업이 실패하는 경우 재시도 또는 특정 로직을 실행시킬 수 있어야 했다.</p>\n<p>처음에는 단순한 구조이다 보니 스크립트로 관리했지만 점차 늘어나는 운영 이슈에 대응하기 위해 Airflow를 활용하기로 결정했다.\n하지만 운영하다 보니 AWS 관련 컴포넌트들의 여러 버그를 발견하게 되었고 이를 수정하기 위해 PR을 추가했었다.</p>\n<br>\n<h2 id=\"아파치-프로젝트-pr-프로세스\" style=\"position:relative;\"><a href=\"#%EC%95%84%ED%8C%8C%EC%B9%98-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-pr-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4\" aria-label=\"아파치 프로젝트 pr 프로세스 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>아파치 프로젝트 PR 프로세스</h2>\n<p>아파치 프로젝트는 이슈 관리 도구로 JIRA를 사용한다. CI 도구는 프로젝트마다 다른 편인데 Airflow의 경우 TravisCI를 사용한다.\n모든 프로젝트에는 처음 프로젝트에 기여하려는 개발자를 위해 <strong>CONTRIBUTING.md</strong> 라는 문서를 제공한다.\n문서에는 개발 및 테스트 환경을 어떻게 구축해야하는지, 지켜야할 규칙, PR 가이드라인 등에 대해 설명되어 있다.\n그리고 PR template를 준수해야 하는데 잘 모르겠다면, 이전 PR들을 확인하고 비슷한 양식으로 작성하면 된다.</p>\n<p>내가 처음 접했던 Airflow 문서에는 AWS 관련 Hook, Operator도 반영되어 있지 않았다.\n그래서 첫 PR로 AWS, GCP 관련 컴포넌트를 업데이트하는 문서 기여를 하게 되었다.\n문서 관리에는 <a href=\"https://readthedocs.org/\">readthedocs</a>를 사용하고 있었고 Sphinx 빌드를 통해 문서를 확인할 수 있었다.</p>\n<p>사용하다보니 특히 EMR 관련 Hook과 Operator에 버그가 많았다.\n만일 JIRA에 이미 등록되어 있는 이슈가 아니라면 이슈를 새로 생성한 다음 PR을 추가해주어야 한다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.89743589743589%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAGVUExURf///+Pl6Ors7v3+/vv7/Pj39/r7+/z8/f7+/olzaqOkpfn6++Hk5t/h5OTm6eXo6uXn6ujq7efp7Pb4+vH09uzv8fP19/v8/KSdlbiuo/b4+ff5+vz8/P39/fT09enp6ujo6efo6Onq6urr6+bm5+rq6+vs7OTl5ujp6ePj5Ozt7ebn5+vr6/Dw8OLi4+zs7e/v8Pj4+Orq6uTl5eXm5uzs7PT09O7u7+Lj4+/v7+vr7OTk5efn6O3u7unp6fLy8uPk5PPz8/fy8fjy8vz9/fr7/OPJyOXNzODj5t3g4t7g4+bo6+bp6+fq7PHz9uvu8PHi4fLl5eXm5+jo6OHi4qKcm42Jifr8/vX5/fb5/vT4/fz9/mBfZnlwbfb6/t7k6tnf5uDm7eLo7uHn7eDm7OPp8OTq8eft9N7k6+ft8/L4/u71++Lo7+Ho7uju9e3z+uju9O/1++7p5unn5vv9/v39/uDg4d3d3t3e3uXl5vbj5NWDhsLAwOnq6+Tl5+vs7e/w8e7v8Ozt7vHy8v38/PLc3fb19D0QhzYAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABaUlEQVQoz2NgAAJGJmYWVjZ2XICDAQY4ubh5eHn5+AUEBAWEBIVRgIiomDhcoYQkm5Q0LiAlLcOAALJy8gqKSvIKyvIqqmoK6hqaKloK2jowSWSFEIIDUwZdoa6evqKqAQNWgKLQUM3IWFnVxNTYjJBCXWNjVXMLbWVLQgotFU00rKxNbFQVNDSV1IxNcSq0NVWzU7HVMLFnYODAa6KWppKRg6OMjCwBq2XZZdiBqrADuDInZxduV9wA4RQ3d24PTy9GbwE+HyFfPjF4PIt584v6+SPFdUCgKzcewI7sRgXtIB35YBtjS0UllRANE20leSVNPXNta0zP4AHMcGWhYeERkVhARFRUFJCKhiuMiY2LT0hMSk5JTUpLSc/IzIKC7JzcvPyCwnC4wqLicHygBMmNpWXlFeWK2irm2oqV8hpK8pVqyJJIbGb2UtwAOe6rqmtq6+rrbRsamxqaGXACDo6W1jYOnACsBgCBSm5XgiaVjwAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAxOC9MBUEAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=488 488w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=975 975w,\nhttps://images.ctfassets.net/tushy4jlcik7/3osQpfWzHK4tY5CXDRahJo/bb37e4751c3631d4f96b9159bba46a7b/pr1.png?w=1950 1950w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>비슷한 이슈를 겪고 있는 사람들이 있어서 좀 신기했다.\n그리고 <strong>아주 작은 수정이라도 테스트 케이스를 추가</strong>해야 한다는 사실을 알게 되었다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.306908267270664%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMQWlDQ1BpY2MAAEiJlVcHVFNJ255bUklogQhICb2J0quUEFoEAamCjZAEEkqMCUHEriyr4NpFBNQVXRVRdHUFZK3Yy6LY+4KKirIuFmyofJMCuu75/+987zkz98k77zxvydy5MwDo1PCk0jxUF4B8SYEsITKUNT4tnUV6AKhAB9CBMzDm8eVSdnx8DIAy+PynvL0OEOXziouS69/j/6/oCYRyPgBIPMSZAjk/H+LfAMBL+FJZAQBEX6i3nl4gVeKJEBvIYIAQS5U4W41LlDhTjStVNkkJHIh3AkCm8XiybAC0m6GeVcjPhjzaNyF2lQjEEgB0yBAH8UU8AcRREI/Iz5+qxNAOOGR+w5P9D87MIU4eL3sIq3NRCTlMLJfm8Wb8j+X475Kfpxj0YQcbTSSLSlDmDOt2M3dqtBLTIO6RZMbGQawP8XuxQGUPMUoVKaKS1faoKV/OgTUDTIhdBbywaIhNIY6Q5MXGaPSZWeIILsRwhaBF4gJukmbuIqE8PFHDWSObmhA3iLNkHLZmbgNPpvKrtD+hyE1ma/hvioTcQf43xaKkVHXMGLVQnBILsTbETHluYrTaBrMpFnFiB21kigRl/DYQ+wslkaFqfmxyliwiQWMvy5cP5ostEom5sRpcVSBKitLw7OTzVPEbQdwslLCTB3mE8vExg7kIhGHh6tyxS0JJsiZfrENaEJqgmftKmhevscepwrxIpd4KYlN5YaJmLh5UABekmh+PlRbEJ6njxDNzeGPi1fHgRSAGcEAYYAEFbJlgKsgB4raeph74Sz0SAXhABrKBELhoNIMzUlUjEtgngmLwF0RCIB+aF6oaFYJCqP88pFX3LiBLNVqompELHkOcD6JBHvytUM2SDHlLAY+gRvwv73wYax5syrF/69hQE6PRKAZ5WTqDlsRwYhgxihhBdMRN8CA8AI+BfQhs7rgv7jcY7Vd7wmNCO+EB4Rqhg3BriniB7Lt8WGAs6IAeIjQ5Z36bM24HWb3wUDwQ8kNunImbABfcE3pi48HQtxfUcjSRK7P/nvsfOXxTdY0dxZWCUoZRQigO38/UdtL2GmJR1vTbCqljzRyqK2do5Hv/nG8qLYDP6O8tsUXYPuw0dgw7ix3EmgALO4I1YxewQ0o8tIoeqVbRoLcEVTy5kEf8L388jU9lJeWu9a7drp/UYwXCIuX+CDhTpTNk4mxRAYsNd34hiyvhjxzBcnd1g7u28jui3qZeM1XfB4R57qtuoQ/cdkkDAwOHv+qi/wRgXycA1LtfdfZH4XYA37Mzq/gKWaFahys7guoLZQCMgTmwBg4wH3fgDQJACAgHY0AcSAJpYDKssgiuZxmYDmaB+aAUlIPlYA2oAhvBZrAd7AJ7QRM4CI6BU+A8uASugTtw9XSB56AXvAX9CIKQEDrCQIwRC8QWcUbcEV8kCAlHYpAEJA3JQLIRCaJAZiELkXJkJVKFbELqkF+RA8gx5CzSjtxCOpFu5BXyEcVQGmqAmqF26CjUF2Wj0WgSOgnNRqehxWgJuhStRGvRnWgjegw9j15DO9DnaB8GMC2MiVliLpgvxsHisHQsC5Nhc7AyrAKrxRqwFvg/X8E6sB7sA07EGTgLd4ErOApPxvn4NHwOvgSvwrfjjfgJ/AreiffiXwh0ginBmeBP4BLGE7IJ0wmlhArCVsJ+wkn4NnUR3hKJRCbRnugD38Y0Yg5xJnEJcT1xN/EosZ34kNhHIpGMSc6kQFIciUcqIJWS1pF2ko6QLpO6SO/JWmQLsjs5gpxOlpAXkCvIO8iHyZfJT8j9FF2KLcWfEkcRUGZQllG2UFooFyldlH6qHtWeGkhNouZQ51MrqQ3Uk9S71NdaWlpWWn5a47TEWvO0KrX2aJ3R6tT6QNOnOdE4tIk0BW0pbRvtKO0W7TWdTrejh9DT6QX0pfQ6+nH6ffp7bYb2SG2utkB7rna1dqP2Ze0XOhQdWx22zmSdYp0KnX06F3V6dCm6drocXZ7uHN1q3QO6N3T79Bh6bnpxevl6S/R26J3Ve6pP0rfTD9cX6Jfob9Y/rv+QgTGsGRwGn7GQsYVxktFlQDSwN+Aa5BiUG+wyaDPoNdQ39DRMMSwyrDY8ZNjBxJh2TC4zj7mMuZd5nflxmNkw9jDhsMXDGoZdHvbOaLhRiJHQqMxot9E1o4/GLONw41zjFcZNxvdMcBMnk3Em0002mJw06RluMDxgOH942fC9w2+boqZOpgmmM003m14w7TMzN4s0k5qtMztu1mPONA8xzzFfbX7YvNuCYRFkIbZYbXHE4hnLkMVm5bEqWSdYvZamllGWCstNlm2W/Vb2VslWC6x2W92zplr7WmdZr7Zute61sbAZazPLpt7mti3F1tdWZLvW9rTtOzt7u1S7H+2a7J7aG9lz7Yvt6+3vOtAdgh2mOdQ6XHUkOvo65jqud7zkhDp5OYmcqp0uOqPO3s5i5/XO7SMII/xGSEbUjrjhQnNhuxS61Lt0jmSOjBm5YGTTyBejbEalj1ox6vSoL65ernmuW1zvuOm7jXFb4Nbi9srdyZ3vXu1+1YPuEeEx16PZ46Wns6fQc4PnTS+G11ivH71avT57+3jLvBu8u31sfDJ8anxu+Br4xvsu8T3jR/AL9Zvrd9Dvg7+3f4H/Xv+/A1wCcgN2BDwdbT9aOHrL6IeBVoG8wE2BHUGsoIygn4M6gi2DecG1wQ9CrEMEIVtDnrAd2TnsnewXoa6hstD9oe84/pzZnKNhWFhkWFlYW7h+eHJ4Vfj9CKuI7Ij6iN5Ir8iZkUejCFHRUSuibnDNuHxuHbd3jM+Y2WNORNOiE6Oroh/EOMXIYlrGomPHjF019m6sbawktikOxHHjVsXdi7ePnxb/+zjiuPhx1eMeJ7glzEo4nchInJK4I/FtUmjSsqQ7yQ7JiuTWFJ2UiSl1Ke9Sw1JXpnaMHzV+9vjzaSZp4rTmdFJ6SvrW9L4J4RPWTOia6DWxdOL1SfaTiiadnWwyOW/yoSk6U3hT9mUQMlIzdmR84sXxanl9mdzMmsxePoe/lv9cECJYLegWBgpXCp9kBWatzHqaHZi9KrtbFCyqEPWIOeIq8cucqJyNOe9y43K35Q7kpebtzifnZ+QfkOhLciUnpppPLZraLnWWlko7pvlPWzOtVxYt2ypH5JPkzQUG8MB+QeGg+EHRWRhUWF34fnrK9H1FekWSogsznGYsnvGkOKL4l5n4TP7M1lmWs+bP6pzNnr1pDjInc07rXOu5JXO75kXO2z6fOj93/h8LXBesXPBmYerClhKzknklD3+I/KG+VLtUVnrjx4AfNy7CF4kXtS32WLxu8ZcyQdm5ctfyivJPS/hLzv3k9lPlTwNLs5a2LfNetmE5cblk+fUVwSu2r9RbWbzy4aqxqxpXs1aXrX6zZsqasxWeFRvXUtcq1nZUxlQ2r7NZt3zdpypR1bXq0OrdNaY1i2verResv7whZEPDRrON5Rs//iz++eamyE2NtXa1FZuJmws3P96SsuX0L76/1G012Vq+9fM2ybaO7QnbT9T51NXtMN2xrB6tV9R375y489KusF3NDS4Nm3Yzd5fvAXsUe579mvHr9b3Re1v3+e5r+M32t5r9jP1ljUjjjMbeJlFTR3Nac/uBMQdaWwJa9v8+8vdtBy0PVh8yPLTsMPVwyeGBI8VH+o5Kj/Ycyz72sHVK653j449fPTHuRNvJ6JNnTkWcOn6affrImcAzB8/6nz1wzvdc03nv840XvC7s/8Prj/1t3m2NF30uNl/yu9TSPrr98OXgy8euhF05dZV79fy12Gvt15Ov37wx8UbHTcHNp7fybr28XXi7/868u4S7Zfd071XcN71f+6fjn7s7vDsOdYZ1XniQ+ODOQ/7D54/kjz51lTymP654YvGk7qn704PdEd2Xnk141vVc+ry/p/Qvvb9qXji8+O3vkL8v9I7v7Xopeznwaslr49fb3ni+ae2L77v/Nv9t/7uy98bvt3/w/XD6Y+rHJ/3TP5E+VX52/NzyJfrL3YH8gQEpT8ZTHQUw2NCsLABebQOAngYA4xI8P0xQ3/NUgqjvpioE/i+svguqxBuAXfMASICNA88ee2Czg5geAoDyqJ4UAlAPj6GmEXmWh7uaiwZvPIT3AwOvzQAgtQDwWTYw0L9+YODzFhjsLQCOTlPfL5VChHeDnz2V6DJT+h58J/8BTNOA947CgZUAAAHsUExURf////7+/vz8/vz9/s7AtdfPx/z7+/f5+vj5+/j5+vf4+vr7/KWYhcC0q+bl5O3v8dve4eTm6eXn6uLk5+Pl6OXo6ufp7Pb4+u7x8+zu8fT2+Obo6/P199fSyvLy8/f39vn6+/r6+/39/fHy8tna2tnZ2tzd3fn6+vb39+Xl5ufo6Ojp6ePk5eLi4+Lj5O3u7unq6uXm5ubm5+Dh4u3t7eHi4vr6+vX4/d/o+OTs+d7o+Ofu+uXt+eDq+OPs+eDp+PT3/P7///7+/+bt+eLr+ebu+ebu+uHq+Ojv+uPr+env+vX19eTk5enp6uLj4+np6ebn5+Pj5O7v7+vr7OPk5Ozt7efn6Ovr6+rr6/T09OTl5eHi49/g4Ojo6eDh4f3+/vz9/fz8/P39/t/o9+Xt+OLr+Onw+vb5/fb29t3e3+rq6+zs7d7f4OXm5+fo6e/w8PT09fj5+fHx8u7u7vv7+/f4+Pf39/n5+fj4+P3t8fzn7P76+/v8/O9+m+xliPjV3vHz9eLl6Ort7+jq7ers7+rs7u3w8uvt8PCEn+1tjfnc4+/x8/L09vX3+fDy9fn7/sPV8q3F7bPK7rrP8Nfj9qSmqKqsrra3uczNzvLz9O3u7+7v8O/w8e3x+O3x9uzt7uvs7e/v8PDw8ebn6FhX3cEAAAAJcEhZcwAAFiUAABYlAUlSJPAAAAAHdElNRQfoARQKBRcn6y5jAAABp0lEQVQ4y2NgAAJGJmb8gAEMWFjZ2DmwA04uLpAUN0QhDy8fv4CgkLCIqJigOCqQEBWUlJKWYYcolJWTV8APFBmgQElZRVVNnQEnUMJgEFSooamlraOtq6evY2BoZKCpbWxiamSGTaG5haWVtY2trY2dvYOjE4OTkyMDgyNWhdaWls4uNtaubjbuNtZ21h6eXp6eXlgUehv6GPj6+WsHGAQaBPgaBunqa2n5BoeEhmkZhkcgK4wMCQyIio6J1YyK9Q3Q0faLC/CJZ0xITFRKYmRkRFbo4O6anGLj4mmT6ukAjlNcvja3c3e3cbeztLEDYvc0Wy8bD3dL63Tc4RgfjzArHgYYkRRmaGX6RcUaRkRoZWlrGcVp+2qGZOdk5qrlBRjnRuUjKSzIVSIuZgoNirKKiVFYUlpWXsGIEyRAlFVWVSvW4AVQE2vr6hsapcWamqVbWpvbxNGBVDss4XZ0dsl0dzc09ABRT08vBujr5YK70ak/CUiVEfZM6oSJkyZPmTpt+gxCKRziuyQcvkYKnpmzZtvaz5nrPm/+gryFs+YvXLS4BM1EAMoGhLQd8pGSAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDE4L0wFQQAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"pr2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=442 442w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=883 883w,\nhttps://images.ctfassets.net/tushy4jlcik7/2MTNBdDgOxA1Tcvl1Zhayn/6a024d91a846c60726fedbc2e206dbf4/pr2.png?w=1766 1766w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>양식만 잘 지키면 커미터들은 정말 친절하다. 내가 파악하지 못한 부분까지 알려주고, 코드 리뷰도 받을 수 있다.\n다른 PR을 참고하면서 많이 배울 수 있었다.</p>\n<br>\n<h2 id=\"클라우드-인프라-테스트-방법\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%9D%B8%ED%94%84%EB%9D%BC-%ED%85%8C%EC%8A%A4%ED%8A%B8-%EB%B0%A9%EB%B2%95\" aria-label=\"클라우드 인프라 테스트 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클라우드 인프라 테스트 방법</h2>\n<p>AWS는 기본적으로 클라우드 환경이다.\n따라서 과금문제로 인해 실제로 추가, 변경한 오퍼레이터가 잘 동작하는지 매번 확인해보기가 힘들다.\nAirflow에서는 AWS 서비스를 Mocking 하기 위해 <a href=\"https://github.com/spulec/moto\">moto</a> 라는 라이브러를 활용해서 테스트를 작성한다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token decorator annotation punctuation\">@mock_s3</span>\n<span class=\"token keyword\">def</span> <span class=\"token function\">test_my_model_save</span><span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># Create Bucket so that test can run</span>\n    conn <span class=\"token operator\">=</span> boto3<span class=\"token punctuation\">.</span>resource<span class=\"token punctuation\">(</span><span class=\"token string\">'s3'</span><span class=\"token punctuation\">,</span> region_name<span class=\"token operator\">=</span><span class=\"token string\">'us-east-1'</span><span class=\"token punctuation\">)</span>\n    conn<span class=\"token punctuation\">.</span>create_bucket<span class=\"token punctuation\">(</span>Bucket<span class=\"token operator\">=</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">)</span>\n    model_instance <span class=\"token operator\">=</span> MyModel<span class=\"token punctuation\">(</span><span class=\"token string\">'steve'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'is awesome'</span><span class=\"token punctuation\">)</span>\n    model_instance<span class=\"token punctuation\">.</span>save<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    body <span class=\"token operator\">=</span> conn<span class=\"token punctuation\">.</span>Object<span class=\"token punctuation\">(</span><span class=\"token string\">'mybucket'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'steve'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>get<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">[</span><span class=\"token string\">'Body'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span>read<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>decode<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">assert</span> body <span class=\"token operator\">==</span> <span class=\"token string\">'is awesome'</span></code></pre></div>\n<p>위와 같이 moto에서 미리 정의한 mock object를 decorator를 사용하여 쉽게 활용할 수 있다.\n하지만 AWS에서 공식으로 지원하는 라이브러리가 아니다보니 업데이트가 늦어지기도 한다.\n이런 이유로 인해 unittest의 mock으로 작성된 테스트 코드도 많이 있다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">class</span> <span class=\"token class-name\">TestEmrAddStepsOperator</span><span class=\"token punctuation\">(</span>unittest<span class=\"token punctuation\">.</span>TestCase<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    <span class=\"token comment\"># When</span>\n    _config <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n        <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n        <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n            <span class=\"token punctuation\">]</span>\n        <span class=\"token punctuation\">}</span>\n    <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">setUp</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        configuration<span class=\"token punctuation\">.</span>load_test_config<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        <span class=\"token comment\"># Mock out the emr_client (moto has incorrect response)</span>\n        self<span class=\"token punctuation\">.</span>emr_client_mock <span class=\"token operator\">=</span> MagicMock<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>operator <span class=\"token operator\">=</span> EmrAddStepsOperator<span class=\"token punctuation\">(</span>\n            task_id<span class=\"token operator\">=</span><span class=\"token string\">'test_task'</span><span class=\"token punctuation\">,</span>\n            job_flow_id<span class=\"token operator\">=</span><span class=\"token string\">'j-8989898989'</span><span class=\"token punctuation\">,</span>\n            aws_conn_id<span class=\"token operator\">=</span><span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">,</span>\n            steps<span class=\"token operator\">=</span>self<span class=\"token punctuation\">.</span>_config\n        <span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_init</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>aws_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'aws_default'</span><span class=\"token punctuation\">)</span>\n        self<span class=\"token punctuation\">.</span>assertEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>emr_conn_id<span class=\"token punctuation\">,</span> <span class=\"token string\">'emr_default'</span><span class=\"token punctuation\">)</span>\n\n    <span class=\"token keyword\">def</span> <span class=\"token function\">test_render_template</span><span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n        ti <span class=\"token operator\">=</span> TaskInstance<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">,</span> DEFAULT_DATE<span class=\"token punctuation\">)</span>\n        ti<span class=\"token punctuation\">.</span>render_templates<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\n        expected_args <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token punctuation\">{</span>\n            <span class=\"token string\">'Name'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'test_step'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'ActionOnFailure'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'CONTINUE'</span><span class=\"token punctuation\">,</span>\n            <span class=\"token string\">'HadoopJarStep'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">{</span>\n                <span class=\"token string\">'Jar'</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'command-runner.jar'</span><span class=\"token punctuation\">,</span>\n                <span class=\"token string\">'Args'</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span>\n                    <span class=\"token string\">'/usr/lib/spark/bin/run-example'</span>\n                <span class=\"token punctuation\">]</span>\n            <span class=\"token punctuation\">}</span>\n        <span class=\"token punctuation\">}</span><span class=\"token punctuation\">]</span>\n\n        self<span class=\"token punctuation\">.</span>assertListEqual<span class=\"token punctuation\">(</span>self<span class=\"token punctuation\">.</span>operator<span class=\"token punctuation\">.</span>steps<span class=\"token punctuation\">,</span> expected_args<span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">if</span> __name__ <span class=\"token operator\">==</span> <span class=\"token string\">'__main__'</span><span class=\"token punctuation\">:</span>\n    unittest<span class=\"token punctuation\">.</span>main<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>unittest로 작성된 테스트 케이스는 API로 주고 받는 json을 직접 정의해줘야 하는 번거로움이 있다.\n테스트 케이스를 작성하고 난 다음 바로 PR을 추가하는 것보다 로컬 CI를 미리 돌려보는게 좋다.</p>\n<p><img src=\"http://drive.google.com/uc?export=view&#x26;id=1MEOqsKocQTV8y5y_y2xrpIppkw2ndOvT\" alt=\"\"></p>\n<p>TravisCI는 오픈소스인 경우 무료로 사용할 수 있으며, yml 파일에 미리 정의되어 있으니 참고하면 된다. 로컬에서 CI가 통과되고 나면 PR을 추가해도 좋다.\n작업이 길어지면서 커밋이 여러 개로 늘어나는 경우, <strong>commit을 squash</strong> 해주는 것이 좋다.\n(나중에 문제가 생겼을 때 쉽게 rebase 하기 위함)</p>\n<br>\n<h2 id=\"잡다한-정리\" style=\"position:relative;\"><a href=\"#%EC%9E%A1%EB%8B%A4%ED%95%9C-%EC%A0%95%EB%A6%AC\" aria-label=\"잡다한 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>잡다한 정리</h2>\n<ul>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-713\">[AIRFLOW-713] EmrCreateJobFlowOperator and EmrAddStepsOperator attributes are not jinjafied</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-950\">[AIRFLOW-950] Missing AWS integrations on documentation::integrations</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1453\">[AIRFLOW-1453] Add 'steps' into template_fields in EmrAddSteps</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/AIRFLOW-1436\">[AIRFLOW-1436, AIRFLOW-1475] EmrJobFlowSensor consideres Cancelled step as Successful</a></li>\n</ul>\n<p>그 동안 5개 정도의 버그를 해결했고 수정했던 AWS EMR 관련 버그들은 1.9 - 10 버전에 모두 반영 되었다.\n이외에도 Airflow에는 여전히 자잘한 버그가 많이 남아있다.\n(Docker로 운영했을 때 로그가 이상하게 나타난다거나, SubDag Deadlock 문제 등)\n당시에 블로그를 열심히 했다면 운영 관련해서 글을 남겼을텐데 하는 아쉬움이 남아있다.</p>\n<p>어쨋든 Airflow를 적용하고 난 뒤, 편히 새벽에 잠들 수 있게 되었다.\n지금은 머신러닝 파이프라인 관련 도구가 많이 나왔지만, Airflow도 충분히 해당 영역을 커버할 수 있다.</p>\n<p>그리고 오픈소스에 대해 다시 한번 생각해보게 되었다.\n많은 사람들이 참여하는 오픈소스이다 보니 당연히 버그나 이슈가 생길 수 있고,\n문제가 생겼을 때 고쳐달라고 강요하거나 기다리는 것보다 스스로 수정해서 기여하는 것이 올바른 태도가 아닌가 싶다.</p>","excerpt":"Apache Airflow는 코드를 통해 워크플로우를 관리하고 모니터링 할 수 있도록 도와주는 플랫폼이다.\nAirflow…"}}},{"id":"e7b082d0-f9d8-5371-aeac-66452691f800","title":"Airflow on Kubernetes (3)","slug":"airflow-on-kubernetes-3","publishDate":"February 05, 2021","publishDateISO":"2021-02-05","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow를 Kubernetes 위에 배포하고 운영하는 방법에 대해 글을 작성해보고자 합니다. 이 글은 시리즈로 연재됩니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-1\">Airflow on Kubernetes (1): CeleryExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-2\">Airflow on Kubernetes (2): KubernetesExecutor</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-on-kubernetes-3\">Airflow on Kubernetes (3): Airflow Logging, Monitoring</a></li>\n</ul>\n<br>\n<h2 id=\"airflow-logging\" style=\"position:relative;\"><a href=\"#airflow-logging\" aria-label=\"airflow logging permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Logging</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.93271461716937%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAAB1FBMVEX////n7vyeuvPr8fzv7+/l5eWLrPA9dOaPr/D5+vv6+vv6+/vr6+z5+vrG1vhtl+3O3Pnc5vrj6/vR3vnt8v1zm+12ne73+fz7+/zu7u/9/f3P3fmApO+Cpe/9/v7y9v10nO1jj+nl6O7p6+7z9Pbh6vtplOx3ner29/jp6+/W3u6Ao+yju+z6+/zX3+7UwsD67Or+/v6sweyPr/FvmOvx8vT8/Pz7+/v3+PitweyOrvHt7e/q6+zi4uLYo5y3WEy7ZVrryMTj5uyatOnAz+2ctuu+zezWiH+1QTOtPjDjr6nW2NvMzdDNz9Lm5+rc3uHOz9LMztHkrqjGZlrBa2D+///09ff09fby8/Xax8Xv4eD29vbBwcHPz8/IyMjOzs7Gxsba2tr5+fno6Oj4+Pj6+vrv8PLx8vP39/j8/f319vfr7O34+frr7O7s7vCRr+uUsezt7vHP2u2BpOu+ze2pv+yHp+vf5O75+fra4fB4nu53ne7g5vGPreuxx/V4nepwmOyUs/G0x+yZtOyctuyGp+vC0O2uw+2Mq+vX2dvY2t3t7/Hq7O/Ky87m6Or29vjx8/Tf4eTQ0tTz8/Pu7+/29vfq6uvt7e3p6enKysrJycnLy8tHIUfMAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAZBJREFUKM9jYCAaMDIxg2kW3IAVrICNnYOTi4uLm4cLAri5EICTixdsBlghH7+AoBCcBwLCIgj7uBAKGbhERMXEJSQkJYBACsiXlpGVgAI5VIXyCopKyhCgAuSrqqlDecoaqAoZ5DSVlbW0daAKGXSBDD0wF6pQ3wCq0BAoZmRsAiRNzczNzS2ADEsrENeaxYaFxdbO3sERpJAbrNDJ2QVmogSI6+oGNpEbyHf38PRCmOjt4+uHpNA/IBBudVBwiCNEYWhYWHgYGHOCBKSA7LAIECEBcWNkFDyoomNi4+ITEqGBJwUESSACGo7J0YgwZTAEIzAwMwOqSQEpTIVI2pohKUQAjbT0jMys7CzdnKzcLE6UcEQFefkFhZxFxSVZpqVl5RV4FFZWVddw1tbVZ5k2NDbhU5jX3FLIqdXalmXa3qGET2FhZ1c3V09vX/+EiZN68ClkmGwOk2RBSRQSXJzI6ZWba8pUIAVOx9O4kH2NAZKmA5N/MguMYGGZwUAIpM6cBYSzpQgqBEamGTgmSQAAAMpTo49TZjIAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-log\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=323 323w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=647 647w,\nhttps://images.ctfassets.net/tushy4jlcik7/4XkuIbWLKoTk3S0k2k7vl5/41a71e9051c7fc2e6e0bffb9e9540dda/airflow-log.png?w=1293 1293w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Airflow의 Task 로그는 PV를 통해 영구 볼륨에 저장하거나 <strong>Remote Logging</strong> 설정을 통해 외부 저장소로 수집할 수 있습니다. S3, ES, GCS 등 다양한 저장소를 지원합니다.\n예를 들어 S3로 설정하면 Task 로그의 수명주기를 S3 Lifecycle에 의해 관리할 수 있게 됩니다.\n참고로 2.0 버전부터 로그 관련 설정은 <code class=\"language-text\">core</code>에서 <code class=\"language-text\">logging</code> 섹션으로 이동했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">logging:\n  remote_logging: \"True\"\n  remote_base_log_folder: \"s3://mybucketname/airflow\"\n  remote_log_conn_id: \"aws_default\"\n  logging_level: INFO</code></pre></div>\n<br>\n<h2 id=\"airflow-metrics\" style=\"position:relative;\"><a href=\"#airflow-metrics\" aria-label=\"airflow metrics permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow Metrics</h2>\n<p>Airflow는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html\">StatsD를 통한 메트릭 전송 방법</a>을 공식 지원합니다.\nK8S 환경에서 많이 사용하는 Prometheus을 통해 메트릭을 수집하는 방법은 아래와 같이 2가지가 있습니다.\nOfficial Helm Chart의 경우 statsd-export를 통해 전송하는 방법을 지원하고 있습니다.\n<code class=\"language-text\">Values.statsd.enabled</code> 옵션을 통해 쉽게 설정하실 수 있습니다.</p>\n<br>\n<p><strong>1. airflow-prometheus-exporter</strong>:\nairflow model 객체를 활용하여 prometheus metrics collector를 구현한 모듈입니다.\nstable/airflow chart에서 옵션을 통해 설정할 수 있으며 airflow plugin 형태로 구현되어 있어 UI의 /metrics 경로에서 로그를 확인할 수 있습니다.</p>\n<p><strong>2. airflow-statsd-exporter</strong>:\nstatsd는 UDP, TCP를 통해 메트릭을 수집에서 전송하는 프록시입니다.\nairflow에서는 공식적으로 statsd를 통해 메트릭을 지원하고 있습니다.\nofficial helm chart에서는 statsd를 통해 메트릭을 수집하고 exporter를 통해 prometheus에 저장할 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.55172413793104%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAB+FBMVEX///+1yvZ9ou/3+f5wme1Adufd5vn6+/v7+/z6+vv6+/z7/Pzo7vzO2/fS3/mVs/Lg6fucuPLE1PepwfRul+2uw+7u7/Lu8PLH1/h1nO2NrO33+v7J1/Po6+7p6+7i5u6VsevJ1e3q7O/P3Pbh5e6yxeykvOzy8/W4ye2YtfKCpOvq6+77+/v6+vr8/Pzu7/B5n+13ne7i5++uxfW90Pfj5uuXsebF0en09PTk5OT3+Pnj5eiwwuanvOfl5unx9f2HqfCKq+/v8fPx8vTh4+XV19rY2t3b3d/T1djR3fbQ2u7n6u6wxO3N2O3r7fD5+vv9/f3x8vP4+Pn+/v7t7u/F0u2mv/Sbtu/4+v7f5/j39/j5+vr39/nl6O2Ys+q6y+12ne4+dObi6fnj5OXk5OXd3+LV1tnS1NafuvNtluzw9P3b5fqivPOKq/D+/v/f4ODm5ubm5+j4+fqyx/WBpO+5zfR9ou5fjOrj6PHt7/Hj5OTz8/PE1fh3ne3L1u3g6PjM1+6lvOzP2e19oe6guezj5+/19fbI1e1vmO2Nq+vx8fH19vfl5+qnvOixw+fo6u3Cx9HY2t/T2ufJz9rO0tnP2On09ffs7vD3+Pp8oe51nOxNf+jm7PjZ4/j6+/79/v+ApO+GqfCatvJwmO309/75+fqkvvPr8fyE//4wAAAACXBIWXMAABibAAAYmwFJdYOUAAAAB3RJTUUH6AEUCgUVyeVPTwAAAatJREFUKM9jYCAaMDIxE6eQhZWNnYOdk4ODkx2IuTi4IEwQxY2ikIeXj18AiSsoBGdzohrJLiwiKgYG4kCehKQUhCPGzcCOqpBbWkZWTl5BUU5OCcRVVpGTU1WTk5NjZ0C1moGDQV1OTkNTS05OW0dXR08fqMbA0AikkIPB2ARJISdIoamZOchEC0sGKzk5axtbO5BCTnsHRycwcIab6OLqBrUaqNDdzcMNYqKnl5y3j6+cnB9EoZ4/BIB9GQBkBAYBiWAGdr0QObnQsHCIwohITkg4siPCMQoSjtEMMXJysXHxEIUJiUkYAZ6cAqZ0QQpT09IhCjMys7KRAyEnN49BB8zSyy8oKLQCgyIQn6u4pJQTDMABXFZeIVYJCfCqgoJq5Jipqa2Tk5OVg/q6vkFOrlEVHOBRWAK8qbkFETythgZAhUE6bVgUtnd0AmNGr8tSr1tOrqe3rx8SjiiAC6TQesJEhImTJk+ZClLIhZZ6GKZVVlZOB2IxSIDPqJ05a/YcUICjmwgCc+fBBeYvWLho8RK4DBwsBcUMr8MydowUzoElQyzPlWCgDgAAHxxav+/v5BcAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-mon\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=363 363w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=725 725w,\nhttps://images.ctfassets.net/tushy4jlcik7/1zXAgK4SzbiJPqbJkfKlaS/53bd066e8011479c197296bc0cefa14e/airflow-mon.png?w=1450 1450w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>수집하는 과정은 위의 그림과 같습니다. statsd-exporter는 Deployment 형태로 배포되며 수집 어노테이션이 정의되어 있습니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.854588796185936%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMWmlDQ1BpY2MAAEiJlVcHWFPJFp5bUklogQhICb2JIjWAlBBaBAGpgqiEJJBQYkwIKnZ0WQXXLqJY0VURRVdXQNaCiGtdFHvfWFBR1sVVbKi8CQnouq9873zf3Plz5sx/SmbunQFAT8WXyfJRfQAKpIXyhMhQ1ri0dBbpESAAGjACKCDyBQoZJz4+BkAZ6P8ub64BRN1fdlNz/XP8v4qhUKQQAIBkQJwlVAgKIG4GAC8RyOSFABDDoN52aqFMjcUQG8lhgBDPVOMcDV6mxlkavK3fJimBC3EjAGQany/PAUC3FepZRYIcyKP7CGJ3qVAiBUDPCOIggZgvhDgJ4mEFBZPVeC7ETtBeBvFOiNlZX3Hm/I0/a5Cfz88ZxJq8+oUcJlHI8vnT/8/S/G8pyFcO+HCAjSaWRyWo84c1vJE3OVqNaRB3SbNi49S1hvidRKipOwAoVayMStbYo+YCBRfWDzAhdhfyw6IhNoc4QpofG6PVZ2VLIngQw9WCTpMU8pK0cxeKFOGJWs718skJcQM4W87laOfW8eX9ftX2rcq8ZI6W/4ZYxBvgf10sTkqFmAoARi2SpMRCrAuxkSIvMVpjg9kUi7mxAzZyZYI6fjuI2SJpZKiGH8vIlkckaO1lBYqBfLFSsYQXq8WVheKkKE19sF0Cfn/8JhDXi6Sc5AEekWJczEAuQlFYuCZ3rE0kTdbmi92TFYYmaOd2y/LjtfY4WZQfqdbbQGymKErUzsVHFcLFqeHHY2SF8UmaOPHMXP7oeE08eBGIAVwQBlhACVsWmAxygaStq6EL/tKMRAA+kIMcIAJuWs3AjNT+ESl8JoJi8AdEIqAYnBfaPyoCRVD/aVCrebqB7P7Rov4ZeeAxxAUgGuTD38r+WdJBbyngEdRI/uFdAGPNh0099k8dB2pitBrlAC9Lb8CSGE4MI0YRI4jOuBkehAfgMfAZApsHzsb9BqL9Yk94TGgnPCBcJagINydJSuTfxDIGqCB/hDbjrK8zxh0gpzceigdCdsiMM3Ez4IZ7QT8cPBh69oZarjZude6sf5PnYAZf1VxrR3GnoJQhlBCK07czdV10vQdZ1BX9uj6aWLMGq8odHPnWP/erOgthH/2tJbYQO4Cdwo5jZ7DDWANgYcewRuw8dkSNB9fQo/41NOAtoT+ePMgj+Yc/vtanupIK91r3TveP2jFQKJpWqN5g3Mmy6XJJjriQxYFfARGLJxUMH8bycPdwB0D9TdG8pl4x+78VCPPsF918uJcDpX19fYe/6KI/APCzNdzmqi86x0vwdQDfx6eXC5TyIo0OVz8I8G2gB3eUKbAEtsAJZuQBfEAACAHhYDSIA0kgDUyEdRbD9SwHU8FMMA+UgnKwDKwG68AmsBXsBHvAftAADoPj4FdwDlwEV8FtuH46wHPQDd6AXgRBSAgdYSCmiBVij7giHggbCULCkRgkAUlDMpEcRIookZnIfKQcWYGsQ7YgNchPyCHkOHIGaUduIveRTuQv5AOKoTTUCLVAHdARKBvloNFoEjoBzUGnoMXoAnQJWolWo7vRevQ4eg69iqrQ52gPBjAdjIlZY24YG+NicVg6lo3JsdlYGVaBVWN1WBP8py9jKqwLe48TcQbOwt3gGo7Ck3EBPgWfjS/G1+E78Xq8Fb+M38e78c8EOsGc4ErwJ/AI4wg5hKmEUkIFYTvhIOEk3E0dhDdEIpFJdCT6wt2YRswlziAuJm4g7iU2E9uJD4k9JBLJlORKCiTFkfikQlIpaS1pN+kY6RKpg/SOrEO2InuQI8jpZCm5hFxB3kU+Sr5EfkLupehT7Cn+lDiKkDKdspSyjdJEuUDpoPRSDaiO1EBqEjWXOo9aSa2jnqTeob7S0dGx0fHTGasj0ZmrU6mzT+e0zn2d9zRDmguNS8ugKWlLaDtozbSbtFd0Ot2BHkJPpxfSl9Br6Cfo9+jvdBm6w3V5ukLdObpVuvW6l3Rf6FH07PU4ehP1ivUq9A7oXdDr0qfoO+hz9fn6s/Wr9A/pX9fvMWAYjDSIMygwWGywy+CMwVNDkqGDYbih0HCB4VbDE4YPGRjDlsFlCBjzGdsYJxkdRkQjRyOeUa5RudEeozajbmNDYy/jFONpxlXGR4xVTIzpwOQx85lLmfuZ15gfhlgM4QwRDVk0pG7IpSFvTYaahJiITMpM9ppcNflgyjINN80zXW7aYHrXDDdzMRtrNtVso9lJs66hRkMDhgqGlg3dP/SWOWruYp5gPsN8q/l58x4LS4tIC5nFWosTFl2WTMsQy1zLVZZHLTutGFZBVhKrVVbHrJ6xjFkcVj6rktXK6rY2t46yVlpvsW6z7rVxtEm2KbHZa3PXlmrLts22XWXbYtttZ2U3xm6mXa3dLXuKPdtebL/G/pT9WwdHh1SH7x0aHJ46mjjyHIsdax3vONGdgp2mOFU7XXEmOrOd85w3OF90QV28XcQuVS4XXFFXH1eJ6wbX9mGEYX7DpMOqh113o7lx3Ircat3uD2cOjxleMrxh+IsRdiPSRywfcWrEZ3dv93z3be63RxqOHD2yZGTTyL88XDwEHlUeVzzpnhGeczwbPV96uXqJvDZ63fBmeI/x/t67xfuTj6+P3KfOp9PXzjfTd73vdbYRO569mH3aj+AX6jfH77Dfe38f/0L//f5/BrgF5AXsCng6ynGUaNS2UQ8DbQL5gVsCVUGsoMygzUGqYOtgfnB18IMQ2xBhyPaQJxxnTi5nN+dFqHuoPPRg6FuuP3cWtzkMC4sMKwtrCzcMTw5fF34vwiYiJ6I2ojvSO3JGZHMUISo6annUdZ4FT8Cr4XWP9h09a3RrNC06MXpd9IMYlxh5TNMYdMzoMSvH3Im1j5XGNsSBOF7cyri78Y7xU+J/GUscGz+2auzjhJEJMxNOJTISJyXuSnyTFJq0NOl2slOyMrklRS8lI6Um5W1qWOqKVNW4EeNmjTuXZpYmSWtMJ6WnpG9P7xkfPn71+I4M74zSjGsTHCdMm3BmotnE/IlHJulN4k86kEnITM3clfmRH8ev5vdk8bLWZ3ULuII1gufCEOEqYacoULRC9CQ7MHtF9tOcwJyVOZ3iYHGFuEvClayTvMyNyt2U+zYvLm9HXl9+av7eAnJBZsEhqaE0T9o62XLytMntMldZqUw1xX/K6ind8mj5dgWimKBoLDSCh/fzSifld8r7RUFFVUXvpqZMPTDNYJp02vnpLtMXTX9SHFH84wx8hmBGy0zrmfNm3p/FmbVlNjI7a3bLHNs5C+Z0zI2cu3MedV7evN9K3EtWlLyenzq/aYHFgrkLHn4X+V1tqW6pvPT69wHfb1qIL5QsbFvkuWjtos9lwrKz5e7lFeUfFwsWn/1h5A+VP/QtyV7SttRn6cZlxGXSZdeWBy/fucJgRfGKhyvHrKxfxVpVtur16kmrz1R4VWxaQ12jXKOqjKlsXGu3dtnaj+vE665WhVbtXW++ftH6txuEGy5tDNlYt8liU/mmD5slm29sidxSX+1QXbGVuLVo6+NtKdtO/cj+sWa72fby7Z92SHeodibsbK3xranZZb5raS1aq6zt3J2x++KesD2NdW51W/Yy95bvA/uU+579lPnTtf3R+1sOsA/U/Wz/8/qDjINl9Uj99PruBnGDqjGtsf3Q6EMtTQFNB38Z/suOw9aHq44YH1l6lHp0wdG+Y8XHepplzV3Hc44/bJnUcvvEuBNXWse2tp2MPnn614hfT5zinDp2OvD04TP+Zw6dZZ9tOOdzrv689/mDv3n/drDNp63+gu+Fxot+F5vaR7UfvRR86fjlsMu/XuFdOXc19mr7teRrN65nXFfdEN54ejP/5stbRbd6b8+9Q7hTdlf/bsU983vVvzv/vlflozpyP+z++QeJD24/FDx8/kjx6GPHgsf0xxVPrJ7UPPV4ergzovPis/HPOp7Lnvd2lf5h8Mf6F04vfv4z5M/z3eO6O17KX/b9tfiV6asdr71et/TE99x7U/Cm923ZO9N3O9+z35/6kPrhSe/Uj6SPlZ+cPzV9jv58p6+gr0/Gl/P7jwIYbGh2NgB/7QCAngYA4yI8P4zX3Pn6BdHcU/sR+E9Ycy/sFx8A6mCnPq5zmwHYB5vDXMgNm/qonhQCUE/PwaYVRbanh4aLBm88hHd9fa8sACA1AfBJ3tfXu6Gv7xO8o2I3AWieorlrqoUI7wabQ9ToqknGO/CNaO6hX+X4bQ/UEXiBb/t/AaY6iU2D1jkcAAAB2lBMVEUvHA0XFxgtLi8jJCUfICItLjArLC4ZGhwWFxkhIiQyMDApKissLC4kJCYjJCYvLzErKy0qKiwgICIAAAALDA0aGx0nJyonKCooKCsoKSsdHiApKSsmJykjIyYiIyUZGRwKCgsMDA4iIiUnJykhISMkJCcpKSwmJikhISQlJSgdHSAmJiYMDQ4lJScYGBgrLCwvMy4vNC8uMi4xNTAwNTAsLywiIiQVFRUuMDAuMS4wMy8tMC0wNC8rLiwWFhYvMy8gICMRERElJictMS0qLCoDAwMsLC8vMDIpKiwqKy0xMjQfHyIuLzEqKywmJygkJSYuLzAsLS8rLC0wMTIwMTMlJigsLS4MDA0kJSctLTAuLjEwMDMqKi0jIyUeHiEfICErKy4fHyEbHB4yMjQvLzIxMTQyODIqLSsrLywxNjAlJyctMS4pLCosLy0eHiAoKSovMi4xNjEpKyozODImKCgyNzE1PDQ0OTI3PjQ8RTg2PTQwNS85QTY0OjMnKSgoKCoyNjEzOTI3PjU0OzMnKCgsLiwuMC8sLi0tLy4rLSwuMS8lJiYtLi4qLCsvMS8uMC4zMzY1NTguLjAmJig0NDckJikcHB8oKiseHyEfHx8nKCsoKi0aGh0KCwxn/JctAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUVyeVPTwAAAhxJREFUKM+NkPtXEkEUxzcV1LAUsd0FWWonFgaUgo2lttkNcklAgbLECBYi0fARPTR7P6wMH72MyN7/a7Mc6ED90vfu3O+dOZ8zc/cSxL6Ozs4unb675x/17jf0dRw42N8/YDQOEqahQ1gkRZs178bLMmylmObGRpqtXdgPE0dYGgBwlKRJbMDO4eQgaSc2yODkIkmHduYmRkY5APFpI1yAaQb0NAotuYljo8e9Pv4E7+e9Pq8Q8LSAXBt4kj0lesXTSELYZMi1gEwbeAaDQVHSwKAohxj4pwt7syEtuYmz7BhSFFHgBaSgcKj1RtB24zl2PBLVxcZ1xgg5QU3GE5Gk7vyFsankxQC4RE2nZqiEwRCzWgjT5TRN0VcyWb3qcpIWs8MxCHJMXtPVAk2G0kzuGq5nCRNLgpwtXizG8QMAqnhmanZOmyl0aXMszs8z9TmaWMN1CSF/aWHRh+Q8lJcUH1y+wS/57SlZWNZ6F8pIuInBWyLi0e07CrYVWPDLi6t315S1hXu2dBmJ9cBfA6zXOFbyufsPJPnho8foydNnnr/A5y0gmFp/EeRfrkriq/UN5nU7OFApVTY3t7Yr4Z2NfA4JSMJt4XhjffvufXin9EEub23j8bDR3ezH6exExgldMO+oJmcSw9V09VNfoLc2V4vsZmopjtP+emgkGot91quTe1izX1T1615D3wqq+v1HNK3VPwnTr57/0m/566CsE9wIdAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMzM1NvvF1yYAAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE2MDaTi/LrAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjAKut6wAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-grafana\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=839 839w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=1678 1678w,\nhttps://images.ctfassets.net/tushy4jlcik7/jcdEsS57RUBfhTQyNx67X/fd363a47e8bedf709df7f117b3f74b4a/airflow-grafana.png?w=3356 3356w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Prometheus에 저장된 메트릭은 Grafana를 통해 데이터 소스로 지정하고 원하는 지표를 시각화할 수 있습니다. 위의 대시보드에 활용한 지표는 다음과 같습니다.</p>\n<ul>\n<li>Airflow Scheduler Health</li>\n<li>Number of Queued Tasks</li>\n<li>Number of Running Tasks</li>\n<li>Scheduling Delay by DAG</li>\n<li>DAG Import Time</li>\n<li>DAG Running Duration</li>\n</ul>\n<br>\n<p>사용자가 작성한 DAG은 Parser를 통해 객체로 변환되고 메타데이터 DB에 저장되는데 <code class=\"language-text\">DAG Import Time</code>은 이 과정을 수행하는데 있어 걸리는 시간을 의미합니다. 위에 언급된 지표 외에도 다양한 지표를 지원합니다. 자세한 리스트는 <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/logging-monitoring/metrics.html#counters\">Airflow Metrics 공식 문서</a>를 통해 확인하실 수 있습니다.</p>\n<br>","excerpt":"최근 Airflow에는 Kubernetes 지원을 위해 다양한 컴포넌트들이 추가되고 있습니다. 이러한 변화의 흐름에 따라 Airflow…"}}},{"id":"37bd75cd-1b56-5ac3-be4b-f45a76e99e36","title":"Data Mesh 아키텍쳐의 네 가지 원칙","slug":"data-mesh-principle","publishDate":"September 25, 2021","publishDateISO":"2021-09-25","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>이 글은 martinfowler.com의 <a href=\"https://martinfowler.com/articles/data-mesh-principles.html\">Data Mesh Principles and Logical Architecture</a> 원문을 정리한 내용입니다. Data Mesh 아키텍쳐의 네 가지 원칙에 대한 내용은 <a href=\"https://martinfowler.com/articles/data-monolith-to-mesh.html\">How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh</a>의 후속글 입니다.</p>\n<br>\n<h2 id=\"the-great-divide-of-data\" style=\"position:relative;\"><a href=\"#the-great-divide-of-data\" aria-label=\"the great divide of data permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>The great divide of data</h2>\n<p>오늘 날의 데이터 환경은 <strong>운영 데이터 영역</strong>과 <strong>분석 데이터 영역</strong>으로 나누어 볼 수 있습니다. 운영 데이터는 주로 마이크로서비스에서 사용하는 데이터베이스에 해당하며 트랜잭션과 비즈니스 요구사항을 담고 있습니다. 분석 데이터는 특정 시간 경과에 따라 집계된 비즈니스 데이터이며 주로 BI / 분석 리포트나 ML 모델링에 사용됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-planes.png\" alt=\"data-planes\"></p>\n<p>데이터 아키텍쳐와 조직 구조 또한 두 가지 데이터 영역을 반영합니다.\n운영 환경으로부터 데이터를 가져오고 ETL 프로세스를 거쳐 분석 데이터를 생성합니다.\n그리고 분석 데이터를 또 다시 운영 환경에 활용하는 경우가 많습니다.\n이러한 데이터 흐름은 빈번한 ETL 프로세스의 실패와 복잡한 파이프라인으로 이어졌습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-warehouse.png\" alt=\"dw\"></p>\n<p>분석 데이터 영역은 <strong>데이터 레이크와 데이터 웨어하우스</strong>라는 아키텍쳐로 나누어집니다.\n데이터 레이크는 데이터 사이언스 환경을 지원하며 데이터 웨어하우스는 분석 리포트 및 BI 도구를 지원합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-lake.png\" alt=\"datalake\"></p>\n<p>Data Mesh에서는 분석 데이터 영역에 중점을 두고 두 가지 데이터 영역을 연결하고 합니다.\n두 가지 영역의 데이터를 관리하기 위해 기술 스택을 나누고 조직과 팀을 분리하면 안 됩니다.\n마이크로서비스 아키텍쳐로 인해 운영 데이터도 과거에 비해 많이 성숙해졌으며 데이터는 각 마이크로서비스의 API를 통해 제어됩니다. 하지만 분석 데이터에 대한 관리 및 접근 제어는 여전히 어려운 과제로 남아있습니다. Data Mesh는 이 부분을 중점적으로 해결하고 합니다.</p>\n<p>Data Mesh의 목표는 분석 데이터와 히스토리로부터 가치를 얻기 위한 기반을 만드는 것 입니다.\n데이터 환경의 지속적인 변화에도 대응하고 데이터의 품질과 무결성을 제공하면서 데이터 사용에 대한 다양한 요구사항을 지원할 수 있어야 합니다. 이 글에서는 이를 달성하기 위한 네 가지 원칙을 제안합니다.</p>\n<br>\n<h2 id=\"domain-ownership\" style=\"position:relative;\"><a href=\"#domain-ownership\" aria-label=\"domain ownership permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Domain Ownership</h2>\n<p>Data Mesh는 지속적인 변화와 확장성을 지원하기 위해 데이터를 가장 잘 이해하는 사람들에게 <strong>책임을 분산하고 탈중앙화</strong>하는데 기반을 두고 있습니다. 여기서 분석 데이터, 메타 데이터에 대한 소유권을 어떻게 나누어야 하는지에 대한 의문이 생기게 됩니다.</p>\n<p>요즘 조직 구조는 비즈니스 도메인을 기준으로 나누어집니다. 이러한 구조를 통해 도메인 경계에 따라 지속적인 발전을 할 수 있게 만듭니다. 따라서 비즈니스 도메인의 경계(Bounded Context)를 기준으로 나누는 것이 적절하다고 볼 수 있습니다.</p>\n<p>이러한 기준을 가지고 분리하려면 분석 데이터를 도메인 별로 나누는 아키텍쳐를 모델링해야 합니다. 이 아키텍처에서 도메인의 인터페이스에는 운영 데이터 뿐만 아니라 도메인이 제공하는 분석 데이터도 포함됩니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domain-notation.png\" alt=\"domain-not\"></p>\n<p>각 도메인은 하나 이상의 운영 API와 하나 이상의 분석 데이터를 제공합니다.\n또한 각 도메인은 다른 도메인의 운영 및 분석 데이터와 의존 관계를 가질 수도 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/domains.png\" alt=\"domains\"></p>\n<p>위의 예시와 같이 Podcasts 도메인은 Users 도메인의 데이터를 통해 Podcast 청취자들의 정보를 데이터화 할 수 있습니다.</p>\n<br>\n<h2 id=\"data-as-a-product\" style=\"position:relative;\"><a href=\"#data-as-a-product\" aria-label=\"data as a product permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Data as a product</h2>\n<p>기존 데이터 분석 아키텍쳐에서 어떤 데이터가 있는지 탐색하고 이해하고 데이터 품질을 유지하는 것이 큰 과제로 남아있었습니다. 이를 해결하지 않으면 Data Mesh 아키텍쳐에서 더 큰 문제로 다가올 수 있습니다. 탈중앙화 원칙에 따라 데이터를 제공하는 곳과 팀의 수가 늘어나기 때문입니다.</p>\n<p><strong>Data as a product 원칙은 데이터 사일로와 데이터 품질 문제를 해결하기 위한 방법</strong>입니다.\n도메인에서 제공하는 분석 데이터는 product로 취급되어야 하며 데이터의 소비자는 고객으로 받아들여야 합니다.</p>\n<p>조직에서는 도메인 데이터에 대한 PO(Product Owner)를 지정해야 하며 PO는 데이터가 프로덕트로써 전달되기 위한 여러 역할을 담당합니다. PO는 데이터 사용자가 누구인지, 어떻게 사용하는지 정의하고 데이터에 대해 깊이 이해하고 있어야 합니다. 데이터 품질, 데이터 사용 만족도를 측정하고 데이터에는 이를 지원하기 위한 표준 인터페이스가 개발되어야 합니다. 데이터 사용자와 PO는 꾸준히 커뮤니케이션을 통해 data product를 발전시킬 수 있습니다.</p>\n<p>각 도메인에는 도메인의 data product를 구축하고 운영 및 제공하는 데이터 개발자 역할도 있어야 합니다. 각 도메인 팀은 하나 이상의 data product를 제공할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-components.png\" alt=\"dataproduct\"></p>\n<p>data product는 위와 같이 세 가지 구성 요소로 이루어져 있습니다.</p>\n<h3 id=\"1-code\" style=\"position:relative;\"><a href=\"#1-code\" aria-label=\"1 code permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Code</h3>\n<ul>\n<li>업스트림 데이터에 대한 ETL 프로세스를 제공하는 데이터 파이프라인 코드</li>\n<li>데이터 스키마, 데이터 품질에 대한 지표, 메타데이터 적용을 위한 API</li>\n<li>접근 제어 정책, 데이터 정책을 적용하기 위한 코드 (비식별화 등)</li>\n</ul>\n<br>\n<h3 id=\"2-data-and-metadata\" style=\"position:relative;\"><a href=\"#2-data-and-metadata\" aria-label=\"2 data and metadata permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data and Metadata</h3>\n<ul>\n<li>이벤트, 배치, 관계형 테이블, 그래프 등 다양하게 소비되는 데이터</li>\n<li>각 데이터에 대한 메타데이터 정의</li>\n<li>생성 로직과 접근 제어 정책</li>\n</ul>\n<br>\n<h3 id=\"3-infrastructure\" style=\"position:relative;\"><a href=\"#3-infrastructure\" aria-label=\"3 infrastructure permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Infrastructure</h3>\n<ul>\n<li>data product 코드를 구축, 배포 및 실행할 수 있는 인프라</li>\n<li>데이터 및 메타데이터에 대한 저장 및 접근을 가능하게 하는 플랫폼</li>\n</ul>\n<br>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/data-product-notation.png\" alt=\"notation\"></p>\n<p>이를 다이어그램으로 표현하면 위와 같습니다.</p>\n<br>\n<h2 id=\"self-serve-data-platform\" style=\"position:relative;\"><a href=\"#self-serve-data-platform\" aria-label=\"self serve data platform permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Self-serve data platform</h2>\n<p>위와 같이 data product를 구축, 배포, 실행 및 모니터링하려면 이를 위해 많은 인프라가 필요합니다. 이를 구성하는데 필요한 기술은 전문적인 영역이라 각 도메인에서 운영하기 어렵습니다. 각 팀이 data product를 자율적으로 개발하고 운영하기 위해 제품의 수명 주기를 프로비저닝하고 관리할 수 있는 추상화된 인프라가 필요합니다. <strong>Self-serve data platform 원칙은 도메인 자율성을 가능하도록 지원하는 플랫폼을 말합니다.</strong></p>\n<p>셀프 서비스 데이터 플랫폼은 데이터 개발자의 워크플로우를 지원할 수 있어야 합니다.\n데이터 제품을 생성하기 위해 필요한 비용과 진입장벽을 낮추고 스키마, 파이프라인 개발, 데이터 리니지, 컴퓨팅 클러스터 등을 지원해야 합니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/platform.png\" alt=\"platform\"></p>\n<br>\n<p>셀프 서비스 플랫폼에는 위와 같이 여러 기능을 제공하는 영역이 존재합니다.\n위 그림에서는 아래와 같이 세 가지 영역으로 나누고 있습니다.</p>\n<h3 id=\"1-data-infrastructure-provisioning-plane\" style=\"position:relative;\"><a href=\"#1-data-infrastructure-provisioning-plane\" aria-label=\"1 data infrastructure provisioning plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Data infrastructure provisioning plane</h3>\n<ul>\n<li>경험이 많은 데이터 개발자만 직접 사용</li>\n<li>data product를 실행하는데 필요한 기본 인프라 프로비저닝을 지원</li>\n<li>분산 스토리지, 스토리지 계정과 접근 제어 시스템</li>\n<li>데이터에 대한 분산 쿼리 엔진 프로비저닝</li>\n</ul>\n<h3 id=\"2-data-product-developer-experience-plane\" style=\"position:relative;\"><a href=\"#2-data-product-developer-experience-plane\" aria-label=\"2 data product developer experience plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Data product developer experience plane</h3>\n<ul>\n<li>일반적인 데이터 개발자가 사용하는 기본 인터페이스</li>\n<li>워크플로우 정의를 위해 필요한 복잡성을 추상화해서 제공</li>\n<li>data product에 대한 빌드, 배포, 모니터링 지원</li>\n<li>미리 정의된 표준 규칙을 통해 자동으로 구현</li>\n</ul>\n<h3 id=\"3-data-mesh-supervision-plane\" style=\"position:relative;\"><a href=\"#3-data-mesh-supervision-plane\" aria-label=\"3 data mesh supervision plane permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Data mesh supervision plane</h3>\n<ul>\n<li>Data Mesh 수준에서 한눈에 볼 수 있는 인터페이스</li>\n<li>data product를 검색할 수 있는 기능</li>\n<li>여러 data product에 걸쳐 필요한 기능</li>\n</ul>\n<br>\n<h2 id=\"federated-computational-governance\" style=\"position:relative;\"><a href=\"#federated-computational-governance\" aria-label=\"federated computational governance permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Federated computational governance</h2>\n<p>지금까지 정의한 내용과 같이 Data Mesh 모델은 분산 아키텍쳐 형태를 가지고 있습니다.\n독립적인 data product를 가지며 각 팀이 구축하고 배포합니다.\n그러나 ML 영역과 같은 곳에서 가치를 얻으려면 각 data product가 상호적으로 운용되어야 합니다. 이러한 상호 운용을 위해 <strong>플랫폼에 의한 의사 결정을 자동화하기 위한 거버넌스 모델</strong>이 필요합니다. 이를 Federated computational governance 원칙이라고 합니다.\n데이터 PO와 데이터 플랫폼 PO가 함께 주도하는 의사 결정 모델은 도메인 의사 결정 권한을 가지며 여러 규칙을 만들고 준수합니다. 이러한 거버넌스를 통해 중앙 집중화와 분산화 사이의 균형을 유지할 수 있습니다.</p>\n<p><img src=\"https://martinfowler.com/articles/data-mesh-principles/governance.png\" alt=\"governance\"></p>\n<p>거버넌스 모델을 구현하기 위해 참여해야 하는 조직과 인센티브 모델을 정의해야 합니다.\n데이터 플랫폼은 거버넌스로부터 정의된 정책을 자동으로 적용하기 위한 기능을 제공해야 합니다.</p>\n<br>\n<h2 id=\"principles-summary\" style=\"position:relative;\"><a href=\"#principles-summary\" aria-label=\"principles summary permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Principles Summary</h2>\n<p><strong>Domain Ownership</strong>을 통해 데이터 생성과 사용자 수의 증가, 데이터 접근 정책의 다양성과 데이터의 확장에 대응할 수 있습니다.</p>\n<p><strong>Data as a product</strong>를 통해 데이터 사용자가 데이터를 쉽게 검색이 가능하고 품질이 보장된 데이터를 사용하며 데이터에 대한 이해도가 올라가고 안전하게 사용할 수 있습니다.</p>\n<p><strong>Self-serve data platform</strong>을 통해 각 도메인 팀이 자율적으로 제품을 만들고 사용할 수 있도록 하며 data product를 쉽게 구축, 실행 및 운영할 수 있습니다.</p>\n<p><strong>Federated computational governance</strong>를 통해 데이터 사용자가 상호 운용을 위한 표준을 따르는 생태계로 운영할 수 있습니다. 이러한 표준 정책은 플랫폼에 반영됩니다.</p>\n<br>","excerpt":"이 글은 martinfowler.com의 Data Mesh Principles and Logical Architecture…"}}},{"id":"381770e9-3117-58b1-979e-b4b146f5a7b3","title":"사이드카 컨테이너로 Airflow 기능 확장하기","slug":"airflow-sidecar","publishDate":"August 01, 2021","publishDateISO":"2021-08-01","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow 2.1 버전부터 공식 Helm Chart가 정식 릴리즈 되었습니다.\n오늘은 공식 차트에서 사용할 수 있는 기능 중 <code class=\"language-text\">extraContainers</code> 옵션을 활용하는 방법을 3가지 예시를 통해 소개해보려 합니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#1-s3-sync-container\">S3 Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#2-permission-sync-container\">Permission Sync Container</a></li>\n<li><a href=\"https://swalloow.github.io/airflow-sidecar/#3-kerberos-container\">Kerberos Container</a></li>\n</ul>\n<br>\n<h2 id=\"sidecar-container\" style=\"position:relative;\"><a href=\"#sidecar-container\" aria-label=\"sidecar container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sidecar Container</h2>\n<p>분산 컨테이너 환경에서 사이드카 패턴이란 Pod 안에서 두 개 이상의 컨테이너로 구성되어 있는 형태를 말합니다. 컨테이너들은 서로 네트워크 또는 볼륨을 공유할 수 있습니다. 사이드카 컨테이너를 활용하면 다음과 장점을 가져갈 수 있습니다.</p>\n<p><strong>기존 로직의 변경 없이 새로운 기능 추가</strong>:\n가끔 일부 기능 추가를 위해 Airflow 저장소 코드를 수정하는 경우가 생길 수 있습니다.\n하지만 이렇게 한번 수정하고 나면 이후에 버전 업데이트할 때마다 새로운 버전 브랜치와 병합해야 하는 번거로움이 생깁니다. 만약 원하는 기능이 사이드카 컨테이너를 활용할 수 있다면 기존 저장소의 변경 없이 새로운 기능을 추가할 수 있습니다.</p>\n<p><strong>컨테이너 재사용</strong>:\n사내에서 개발 환경에 따라 또는 접근 권한에 따라 Airflow 인스턴스를 여러 개 구성하고 운영하는 경우가 많습니다. 사이드카 컨테이너로 구성한 기능은 재사용이 가능하기 때문에 새로 배포한 Airflow 인스턴스에 쉽게 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"airflow-extracontainers\" style=\"position:relative;\"><a href=\"#airflow-extracontainers\" aria-label=\"airflow extracontainers permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow extraContainers</h2>\n<p>Airflow Helm Chart에서는 <code class=\"language-text\">extraContainers</code> 옵션을 통해 사이드카 컨테이너를 scheduler, webserver, worker에 정의할 수 있습니다. <del>제가 기여한 옵션입니다!</del> (<a href=\"https://github.com/apache/airflow/pull/13735\">https://github.com/apache/airflow/pull/13735</a>)</p>\n<p>이제 몇 가지 예시를 통해 어떻게 활용할 수 있는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"1-s3-sync-container\" style=\"position:relative;\"><a href=\"#1-s3-sync-container\" aria-label=\"1 s3 sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. S3 Sync Container</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAIRQTFRFAQEB1tbW1tbW7e3t7e3tysrKzc3Nzs7O0tLS1tbW2dnZ2tra3d3d4ODg4eHh4uLi4+Pj5OTk5eXl5ubm5+fn6Ojo6enp6urq6+vr7Ozs7e3t7u7u7+/v8PDw8fHx8vLy8/Pz9PT09fX19vb29/f3+Pj4+vr6+/v7/Pz8/f39/v7+////gmbWFQAAAAV0Uk5TAXBx4eO/YfyVAAAA60lEQVQoz42T6xqCIAyGMe1sFmaeYlqppe7+768hRU+a0n7w4XjlgwGMzRwwhjNjzMKpyCTWUMdiNm7dMSzuGMxPiDaDiflioZwJhEkQ8HHw+JXUAJ6xTny/JDWANVlHZF2ZQGWvxAwu+Ru86LpW30wlcyvZXDsQ+jbDT3iB4gh+lN6HYBqINIpzDUZ+wF33F8h3yd4LNPindS6XG8qmpFyh9lVQt9QDl0953n9nodIwG6kjSXW4kTZqxoYStSeGYAyQrMlmgXicbwhYEL3llB05mUK0UlpR9DZGF7d/Zl30s7bhKeiw2L+P6wnIUn6JVS/W6wAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"s3-sidecar\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/72F13S5hekKyVz9z9rCAKq/fc48e2c5b5f1ed47ff26a21fff2fc8f4/s3-sidecar.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>AWS MWAA 처럼 <strong>S3를 DAG 저장소로 활용하고 싶은 경우</strong>에 S3 Sync 사이드카 컨테이너를 통해 구현할 수 있습니다. S3 Sync 사이드카 컨테이너는 S3 버킷에 올라간 파일을 DAG 경로에 주기적으로 동기화하는 컨테이너입니다. 만약 DAG Serialiaztion 옵션이 활성화되어 있다면 scheduler에만 정의하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">scheduler</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> s3<span class=\"token punctuation\">-</span>sync\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/s3<span class=\"token punctuation\">-</span>sync<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AWS_BUCKET\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>src\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KEY_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> DEST_PATH\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /opt/airflow/dags\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"10\"</span></code></pre></div>\n<br>\n<p>위와 같이 인스턴스마다 서로 다른 설정이 필요한 값들은 환경변수로 구성할 수 있도록 이미지를 정의합니다. S3 접근 권한은 직접 credential을 사용하는 것보다 EKS의 IRSA를 활용해서 Role 기반으로 제어하는 편이 좋습니다. Dockerfile은 <a href=\"https://github.com/Swalloow/s3-sync\">s3sync</a> 저장소를 참고하시면 됩니다.</p>\n<br>\n<h2 id=\"2-permission-sync-container\" style=\"position:relative;\"><a href=\"#2-permission-sync-container\" aria-label=\"2 permission sync container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Permission Sync Container</h2>\n<p>2.0 부터 추가된 <strong>DAG level Permission을 사용하는 경우</strong>, airflow sync-perm 명령어를 통해 DAG 권한을 갱신해주어야 Role에 권한제어가 정상적으로 반영됩니다. Permission Sync 컨테이너는 webserver에서 주기적으로 <code class=\"language-text\">sync-perm</code> 명령어를 수행하는 역할을 합니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">webserver</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> sync<span class=\"token punctuation\">-</span>perm\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> apache/airflow<span class=\"token punctuation\">:</span>2.1.2<span class=\"token punctuation\">-</span>python3.7\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">command</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"/bin/sh\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">args</span><span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token string\">\"-c\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"while true; do airflow sync-perm; sleep 60; done\"</span><span class=\"token punctuation\">]</span>\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> dags\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/opt/airflow/dags\"</span>\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> AIRFLOW__CORE__SQL_ALCHEMY_CONN\n          <span class=\"token key atrule\">valueFrom</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">secretKeyRef</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">key</span><span class=\"token punctuation\">:</span> connection\n              <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>dev<span class=\"token punctuation\">-</span>airflow<span class=\"token punctuation\">-</span>metadata</code></pre></div>\n<br>\n<p>보시면 Airflow 이미지와 정의된 connection을 재활용 합니다. 컴포넌트 컨테이너와 분리되어 있으니 사이드카에서 발생하는 로그만 따로 확인할 수도 있습니다.</p>\n<br>\n<h2 id=\"3-kerberos-container\" style=\"position:relative;\"><a href=\"#3-kerberos-container\" aria-label=\"3 kerberos container permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. Kerberos Container</h2>\n<p>클러스터에 접근하기 위해 Kerberos 인증이 필요한 경우, Kerberos 컨테이너를 활용하면 인증 토큰 갱신을 자동화할 수 있습니다. <a href=\"https://airflow.apache.org/docs/apache-airflow/stable/production-deployment.html#kerberos-authenticated-workers\">Airflow 공식 문서</a>의 production-deployment 부분을 보면 아래와 같은 내용이 있습니다.</p>\n<blockquote>\n<p>In the Kubernetes environment, this can be realized by the\nconcept of side‐car, where both Kerberos token refresher and\nworker are part of the same Pod. Only the Kerberos side‐car has\naccess to Keytab secret and both containers in the same Pod\nshare the volume, where temporary token is written by the side‐\ncare container and read by the worker container.</p>\n</blockquote>\n<p>대략 K8S 환경에서 사이드카 형태로 구성하는 방법에 대한 내용입니다.\n이를 그림으로 그려보면 아래와 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.478707782672544%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAQAAAAYhxY7AAAACXBIWXMAAB7CAAAewgFu0HU+AAAAB3RJTUUH6AEUCgUVyeVPTwAAAepJREFUOMutld2u0kAUhb/+0JbDT1EIaDRcaLzywlcjPojHZzORGM0xkZgYjmIYSikDbcebodBOe0jUNRedme5Zs/eaPXssy/o4m7x1nvPPyL4v371+z3y2Vp/UQf0NhFrrlumZ+cxafRtMJQFWsVOOrOzt0jL8+UWLHrYeReyYAL8XrjO1aZdMV4SVxZIDHYNSERlzztQ25vDwyNmSESHJ8eiSGlYtBmTck7AjJSQooqkXmC847HB5wZNaixwIGKGI8fX4AcIOL8lRZIwbzrTPGgubHzwFBDfNhEdSYFB4knOoMXO0RVpRvIbwEYnubehrvXya4DKny7RMuCUzDAN8MroNNJJ90XsGCMClcyLMjEQBob36SsQb4+++dkUpZMkHwCelx6tCP8GQIYIjfbwKwYocR+voFZq7Z/4hMTE9NhdqnrdThkcpEosWOZLUJBw3JghQQweThkMCbB0/yOI8T9+Eg9YnBDx9Tf2aFc6ZsHchbFnsDXvGmgzgniN9ICiumriehyD5yWNuAMWo8AVgRASsiOmwo3uh8gmV4nBEINgSsUUguMMmZMdnlihCbO4QxKQIErYIo2xYa2Vm1BkJkrColQqBXyl2ZQjcbHFxbwy0aZdCHvAwsoW9vL1iQ3jRrmF5a/3vR+oPMu3n/rlu1tgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kerberos\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=341 341w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=681 681w,\nhttps://images.ctfassets.net/tushy4jlcik7/3Unp3SJDghgcGuQxCJNHNZ/e6347df7cf93baac02b581d8f6e42f1a/kerberos.png?w=1362 1362w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>kerberos 컨테이너는 keytab이 존재하는 볼륨에 접근하고 kinit 명령어를 통해 ccache를 갱신합니다. airflow 인스턴스들의 worker는 해당 볼륨의 갱신된 토큰을 통해 인증을 달성할 수 있습니다. prod, dev와 같이 여러 airflow를 사용하더라도 kerberos의 컨테이너에서 한번만 캐시 업데이트를 수행하면 됩니다.</p>\n<p>예시는 아래와 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">worker</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">extraContainers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> worker<span class=\"token punctuation\">-</span>kerberos\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> myrepository/kerberos<span class=\"token punctuation\">:</span>latest\n      <span class=\"token key atrule\">imagePullPolicy</span><span class=\"token punctuation\">:</span> Always\n      <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n          <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> /etc/keytab\n      <span class=\"token key atrule\">env</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> INTERVAL\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"3600\"</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> KRB5_CONFIG\n          <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> /etc/keytab/krb5.conf\n\n<span class=\"token punctuation\">...</span>\n\n<span class=\"token key atrule\">extraVolumes</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">persistentVolumeClaim</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">claimName</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>keytab\n<span class=\"token key atrule\">extraVolumeMounts</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> keytab\n    <span class=\"token key atrule\">mountPath</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/etc/keytab\"</span></code></pre></div>\n<br>\n<p>위와 같이 keytab이 존재하는 볼륨을 마운트해주어야 합니다.</p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>이외에도 사이드카 컨테이너를 잘 활용한다면 다양한 기능으로 확장할 수 있습니다.\n<code class=\"language-text\">extraInitContainers</code> 옵션도 있으니 함께 활용해보면 좋을 것 같습니다.</p>\n<ul>\n<li><a href=\"https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html\">https://airflow.apache.org/docs/helm-chart/stable/using-additional-containers.html</a></li>\n</ul>","excerpt":"Airflow 2.1 버전부터 공식 Helm Chart…"}}},{"id":"1b2de017-d945-522e-be73-569bf48aea40","title":"Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들","slug":"spark-on-kubernetes-spot-instance","publishDate":"July 23, 2022","publishDateISO":"2022-07-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~90%의 비용을 절감할 수 있습니다.\n하지만 스팟 인스턴스는 가격 입찰, 가용성 등 여러 이유로 중단될 수 있습니다.\n따라서 스팟 인스턴스를 사용한다면 노드가 중단되는 상황에 대비할 수 있어야 합니다.\n이 글에서는 Spark on Kubernetes를 스팟 인스턴스 위에서 안정적으로 운영하기 위해 필요한 설정들을 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"driver는-on-demand에-할당하기\" style=\"position:relative;\"><a href=\"#driver%EB%8A%94-on-demand%EC%97%90-%ED%95%A0%EB%8B%B9%ED%95%98%EA%B8%B0\" aria-label=\"driver는 on demand에 할당하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>driver는 on-demand에 할당하기</h2>\n<p>중단된 노드에 있던 <code class=\"language-text\">driver pod</code>가 종료되는 경우, Spark 작업은 실패하게 됩니다. <code class=\"language-text\">executor pod</code>가 종료되는 경우, 캐시된 데이터 또는 셔플 파일을 잃게 되지만 새로운 executor를 통해 이를 다시 계산하기 때문에 전체 작업이 실패하지는 않습니다.</p>\n<p>위와 같은 이유로 <strong>driver는 온디맨드 인스턴스에 할당</strong>하는 것이 안전합니다.\n노드 그룹을 분리하고 <code class=\"language-text\">nodeSelector</code>를 활용한다면 driver는 온디맨드에서, executor는 스팟에서 실행하도록 설정할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"적절한-인스턴스-유형-선택하기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%A0%88%ED%95%9C-%EC%9D%B8%EC%8A%A4%ED%84%B4%EC%8A%A4-%EC%9C%A0%ED%98%95-%EC%84%A0%ED%83%9D%ED%95%98%EA%B8%B0\" aria-label=\"적절한 인스턴스 유형 선택하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적절한 인스턴스 유형 선택하기</h2>\n<p>일부 인스턴스 유형은 해당 시점의 spot market 상황에 따라 안정적으로 확보하지 못할 수도 있습니다. 확보를 못하게 되면 executor는 계속 pending 상태에 머무르게 되고 전체 수행시간도 지연됩니다.</p>\n<p>사용량에 비해 크기가 큰 인스턴스 유형을 선택했다면, 여러 <code class=\"language-text\">executor pod</code>가 하나의 노드에 할당됩니다. 이 때 해당 노드가 중단된다면 여러 executor가 종료되므로 재계산에 더 많은 시간이 소요됩니다.</p>\n<p>위와 같은 이유로 적절한 인스턴스 유형을 선택하는 것이 spot kill을 줄이는데 도움이 됩니다.\nKarpenter를 사용한다면, 여러 인스턴스 유형을 지정하여 Pod의 리소스 요청량에 가장 적합한 노드를 프로비저닝 할 수 있습니다. 또한 <code class=\"language-text\">Instance Fleet</code>의 <code class=\"language-text\">Allocation Strategy</code>에 따라 가장 안정적으로 확보 가능한 인스턴스 유형을 선택할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-31-graceful-executor-decommissioning\" style=\"position:relative;\"><a href=\"#spark-31-graceful-executor-decommissioning\" aria-label=\"spark 31 graceful executor decommissioning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.1: Graceful Executor Decommissioning</h2>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 Spark 3.1 버전에 추가된 기능입니다.\n이 기능을 통해 <strong>노드가 중단되더라도 최소한의 손실로 Spark 작업이 지속되도록 설정</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Node Termination Handler</code>가 설치되어 있어야 합니다. <code class=\"language-text\">Node Termination Handler</code>는 클라우드에 따라 다르게 설치할 수 있도록 지원하고 있습니다.</p>\n<p>이제 노드가 중단되었을 때 과정을 아래 그림을 통해 확인해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.34972677595628%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAX1QTFRF/////v37/ffo/fnt/fv27ODA39Kz4NS159q6++3L/PLX+ujK++bP897I4c6669jC+u3T9OrS8urY9+7Y8+/j9fX18/Pz2tra29vb3t7e4eHh9e/d/fz39O3b8+/i8e3g9/De+Pj49PT09vb27+/v+vr69/f34ODgurq6vr6+t7e3yMjI5+fn39/f3d3d/fvz8uzd/vv0/fnu8evc/v35/fbl4NS03dCy++7L/ffp9OvU4dS15Ne4/O7M/frz+uTK6tbB4c659eDK+uXK+u/W5NG85dG89N/J+ufK+OHM6szD2r617s/G9NfI4sW838O69NfJ+PLk8fHx+O3U+ODL7MrD6MfA7cvD8dTF6snB6cjB8dPGxMTEvLy8tLS00dHR6snE1Lex7MvG8tTG38C73L248tTI9une6M/C8urZ8ejV+O/a8+nT+e/h7ODe6enp2dnZ7Ozs8fDt9vDe4+Pj8vLy8+/l/Pfo8u3f/fjr+PHg9O3c/fv03Nzc7e3tPlBKWQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAElSURBVDjLY2AYLICRCQaY8StkYWVj5+AEAS4CCrl5eHj5+Hl4eAQIK4QA+isUFIICYQIKRUTFxCUkpURFpfErlJGVk5OTB2I5BSJCXZSAvKKokigQKCurKMNYqtgVqqlraGppaOswMKip64qr60kwKKOr0QfFrgGIMIQJGYF4xiDCBEmhqZk5OII5LSxhQlbWNhAhWztkhfY8PA6OTjw8znCFLsBAd3Vz5+HxQFcIBkgKPb28fXz9/ANwKAxUU1ZWFlVWCwoOCQ0Lj4iMisZpolJMbFy8GoNLSEJiUnJKahqKwvSMTAjIgludDRXJzEFWmJsnmi8hWVAoWgRXWCwqWiKuW1AqWoassBwcvUBQUQkTqoKKyFXXoAS5Sq24uqREHT0zMgDtVjh3QFIj9AAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2NJGgO8cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADk4NvSU354AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-decom\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=732 732w,\nhttps://images.ctfassets.net/tushy4jlcik7/315V3THD4uhXyyad1fIbNH/cf51c68cfb4ce7c016d885a15813aa35/spark-decom.png?w=1464 1464w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ol>\n<li>스팟 인스턴스가 중단되기 약 120초 전에 <code class=\"language-text\">Termination Handler</code>의 notice 발생</li>\n<li>driver가 해당 executor를 blacklist에 추가하고 신규 task의 스케줄링을 차단</li>\n<li>중단되는 노드에 있던 캐시된 데이터, 셔플 파일을 다른 노드로 복제</li>\n<li>실패 처리된 task를 이어서 수행 (복제한 파일을 그대로 활용)</li>\n</ol>\n<br>\n<p>위의 과정을 통해 노드가 중단되었을 때 재계산을 최소화 할 수 있습니다.<br>\n이 기능에는 다음과 같이 일부 제한 사항도 존재합니다.</p>\n<p>120초의 시간 제한이 있기 때문에 <strong>옮겨야할 파일이 아주 큰 경우, 일부 파일 손실이 발생</strong>할 수 있습니다. 일반적으로 non-SSD 볼륨은 분당 최대 15GB, SSD 볼륨은 35~40GB 까지 가능합니다. 동시에 많은 executor가 spot kill 당하는 경우, 동일한 이유로 파일 손실이 발생할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.decommission.enabled\nspark.storage.decommission.enabled\nspark.storage.decommission.rddBlocks.enabled\nspark.storage.decommission.shuffleBlocks.enabled</code></pre></div>\n<p><code class=\"language-text\">Graceful Executor Decommissioning</code>은 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-32-executor-pvc-reuse\" style=\"position:relative;\"><a href=\"#spark-32-executor-pvc-reuse\" aria-label=\"spark 32 executor pvc reuse permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark 3.2: Executor PVC Reuse</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.49127182044888%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAoVQTFRF/////v7++vr69fX16N7C5tzA/PHS/frz/frx4de87+TH+/DT+PLh29G3+u/Q/PTf+uzK++rK++zK/fry/frw+u3N/Pbj+unI/PTd+enI++bP9eDK6dbA69fC89/J+ujK8NzG69fB+OTN+erK+uTJ6tfB7NjC+uTK/PPc+OPM7NjD8d3H9uHL8t7I79vG+uXO7trE8t7H+ezL+evJ8uTD+uzL/PXj+erJ+/Pd7ubS7ebR8+vV/fz2/fv16eLO8+vW+/Te+fXp5d7K+/Pc/Pfn9unI9ObF8+XE/O7M9OfF9+nH++7O+/Xi797D+OfL8ODF89jG997K8M/J8dDN78zJ4M6538243su35dK92si03Luv3MCx79vF5sbD07a01Le01rm26MjF+unK9eTG++vK9eTF+u3M9d7J9d7K8NnG9N3J9PHq/v78/fvz/vz4/vz3+fn56Ojo/f395+fn/Pz8+/v73t7e1tbW3Nzc2NjY29vb4eHh+Pj49/f32tra6urq8fHx7u7u19fX8vLy8/Pz8PDw8ODf69jW7NjW8N3c8ePi79rZ9PT079vZ6tfV7dnX8eTj79zb8OHg8uvr7NnX69fV8Nza8OTk7trY8ujo7tjW2cC+1Ly57dTR79za3cPB0bi27dDN9PPz0bm33cPA797c7dLQ1by62b+97tnY8efn5crI0rq45crH7t7d6c3L0rm34cfE8OPi79TR1re00bOx7s/M79jW2bq4zrCu7crH7svIza+t27y579rY7s3K1re179XT8eXk48LAzrGu5sXC7drY6MfEzbCt4cG+8OHf7+/v7+bl7+Pi7uTj7+fn7uLh7+jn7uPi7+bm8Ozs7+jo8OvqZPiBhAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAG1SURBVBgZlcHLahNhHMbh3zvfP5kcZlpommpcVepCRNxZEHGhoHTtbaQeEBeCCFWyELqpd9ILEBHpSneCFBcRFBE1WI2kzamT8ZtMa7vU5+HfKeCI4xjHMQKTyGlYkvaZKuwSSQOmyl0MIpGThtEkDZmyXSoaVckU1cWgLOTtU+hBPKaocXFAuQPxHq6kHrG+EpCZ8TgUxxZzqDauMmXQEKC0QdCDhQmoRoNPsJjMwnzawMRfjiOOYxw5wSV9gKU2cGbrivSepTZw9iVXpXcstYHzzzGINIJoBMtv2L6oEdEIqEJVWkY14DU46HfM7LuZ7Yz6le4Xs8XFb2bdn/w67ZwLnHMWfMbIXJb0ilz9nHTtBbmKvN94Bv2bgNIVNgXXJ+ASVrA21AVKqQdbZMJMM/RWWQ29Zujdgtuh1wy9OyC4i6cUeJbemwAuwdvg/j7gEqCwjkFRmafAw1Y1SZSGasEjiAcTR0lr8BgMZpVpyT0A5pRpqbIDTzaUWU+jDhgwrxzeQhpoagc4oQMdMKChHJlT8vaq2gZO6sBbMLghIU1waz9IP15IMM1QLABzQygNoMx/+APZf2+gv1qXRwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTYwNMR+SC8AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADg1OKdA5uMAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-reuse\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=401 401w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=802 802w,\nhttps://images.ctfassets.net/tushy4jlcik7/2gUc710YoiViDEOzz2ymvR/6dedcbcbb552efa10c0e359d90872ffb/spark-reuse.png?w=1604 1604w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">Executor PVC Reuse</code>는 Spark 3.2 버전에 추가된 기능입니다.\n이 기능을 통해 spot kill 이후에도 <strong>동일한 PVC 연결을 통해 셔플 파일을 재사용</strong>할 수 있습니다. 이를 사용하려면 먼저 클러스터에 <code class=\"language-text\">Dynamic PVC</code>에 대한 설정이 필요합니다.</p>\n<p>현재는 NVMe 기반의 SSD에서 사용이 어렵다는 제한 사항이 있습니다.<br>\n또한 PVC가 즉시 재사용 불가능한 상황이라면 race condition이 발생할 수도 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">spark.kubernetes.driver.reusePersistentVolumeClaim\nspark.kubernetes.driver.ownPersistentVolumeClaim\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.options.*\nspark.kubernetes.executor.volumes.persistentVolumeClaim.data.mount.*</code></pre></div>\n<p>Executor PVC Reuse는 위의 설정을 통해 활성화 할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/\">https://databricks.com/it/dataaisummit/session/how-make-apache-spark-kubernetes-run-reliably-spot-instances/</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-20624\">https://issues.apache.org/jira/browse/SPARK-20624</a></li>\n<li><a href=\"https://issues.apache.org/jira/browse/SPARK-35593\">https://issues.apache.org/jira/browse/SPARK-35593</a></li>\n</ul>","excerpt":"스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…"}}},{"id":"c4c76da9-9abb-5367-906a-faa948a032fa","title":"컨테이너 환경을 위한 초기화 시스템 (tini, dumb-init)","slug":"container-tini-dumb-init","publishDate":"May 27, 2022","publishDateISO":"2022-05-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 <code class=\"language-text\">ENTRYPOINT</code>에 <code class=\"language-text\">tini</code>, <code class=\"language-text\">dumb-init</code>과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb-init을, SparkOperator에서는 tini를 사용하고 있습니다. 이 글에서는 컨테이너 환경에서 왜 이러한 초기화 시스템이 필요한지 알아보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"pid-1의-역할\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-%EC%97%AD%ED%95%A0\" aria-label=\"pid 1의 역할 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 역할</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 59.98293515358362%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABg1BMVEUAAAAAAAAAAAAAAAAEFRwiJi4lQCoGKCwOKTMDKTMBKzUONT8SOUIFLTgBKjULMz0JMTsNND4DIy4EFhwDFhsCCw0dMTkYLTQXLDQUKzIUKzMPKTASNTsZPUENLzUOMTcLLTQZLTkfMDwKJjAKJDUJJDQKIzcIJDUJIzgJIzcLJjQlNEALKDIAAAAAAAAAAAARKzUTNDUJLDULLDcIMDoHMTsELjgCLDcGMDoCLTcIMTsFLzkLND4ROUMAKzYELjkDKDISOUMIMTwQN0EONkAQOEISOkMIMjwPN0ETOkQFLzoTOkMJMj0YPkgQOEEMNT8WPEYVPEUZP0gROUIJMjwNNT8MND8VPEY1VV09XGI+XGM/XWQ+XWNCYGZBX2ZDYGdAXmU9XGM6WWA7WmFFYmg8W2IKMz0BLDcMND4XPUcUO0QDLTgLMz4HMDsUO0UJMz0GMDsNNkACLTgKMz4NNUAVO0UROEIWPUYNMz4HMjwLNT8BLDYELTkDLDgAKzcBKzcBKzbhEENnAAAAMHRSTlMAAQIDE7W4uLi4uLi4uLi4uLi1KzAclZ6fn5+fn5+fn5+fn5+fn5+fn5+fnpUIFx0umrCDAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCgUUvuJ/2QAAAb9JREFUGBmFwUtPE1EAhuH3O3MO0xbGcglKMZCAF6IVAgsTVsa/7k6j0ZrGapAINUQQaBGGSi8zcyyYIHYWPI+QxG2891KgK1zTUOLU51qos9SqvKAr3kg+DYykfoguClyT6idWmpI33uiiKGngzqNeoePxBf7xXrJQSq3UD8ez9kQxDUvy2fg5ORZSFdoTaeyySitUqHM6zvK/GCxMShWVhbJFDZV6CwNGBDtY+DG2rJPs0JJMdaPTB+5gcmelzigDjG9/vtumWqXVbvrM+a8peRYYc51g7X0A63pNw836qTo5FlYPB7x5Tgq1Hjw9Okv2DTmBKbISb7S+ud0958vWlX937iQZI466BpL6PC4iiqhE02nDO3XJM4DlJgW/yuQZsMn2u2dQrXKv2fT4kq2ukmOgN+2exDFBAJuwvtgpva2TY2BtcVBjkzSl9gn64diKIy8wRV+JHzfa2e6eq7ZC1w3vaz9lxFHXwnx9ubbhPkYkrWlOH24lSaFPjuFSuN9jqN+G7y7pzpNnYXlyj6UtUlj68EjxwZKZ+cLQC71i6CU6nm0gM6NLnktGQ/ylm362rJ+TuI2fOxaSuI33/g+OJqt2WzDTvwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAE3RFWHRleGlmOkV4aWZPZmZzZXQAMTAyc0IppwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMjM0NLRs4C4AAAAZdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADE0MDaQDyaFAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"cmd-top\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=586 586w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=1172 1172w,\nhttps://images.ctfassets.net/tushy4jlcik7/5IpajNkGdYFcuhxttrNIFk/0d3d9fa20afd459982cd8ab8d1e124e0/cmd-top.png?w=2344 2344w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>리눅스에서 <strong>PID 1은 부팅 시 커널에 의해 최초로 실행되는 init 프로세스</strong>입니다.\ninit 프로세스는 SSH 데몬, Docker 데몬, Apache/Nginx 시작 등과 같은 시스템들의 시작을 담당합니다. 각 프로세스는 차례로 추가 하위 프로세스를 생성할 수 있습니다. PID 1은 결국 모든 프로세스의 최종 부모 프로세스 역할을 하게 됩니다. 현재 배포판들은 복잡한 init 대신 systemd가 초기화 시스템의 역할을 대신하고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.26530612244898%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAK5QTFRF////8fHx7Ozs6enp4+Pj5+fnzMzM2tra5OTk19fX39/f2NjY1tbW+vr67e3t7u7u9PT0/Pz8+fn58/Pz/v7+29vb7+/v09PTy8vL1NTUxcXFz8/Pvb290NDQ3d3dvr6+1dXV3NzcxMTEyMjI4eHhwcHB0dHRx8fH3t7eycnJ6+vr4ODg9OLF9d278dq57+PN9uXM++bP7uLNu6uaxbSi2si0z76r8ebT6dnA7eXXSY1bDgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAADBSURBVDjLvZFHAsIwDAQ3BCQQvYcaeje9/v9jHHDoYF9gTlp7vD4I+DVOSOMaxFAwhM1ihDhqJdo1OjERiYtIIvnVS6Wuten0Zy3jZu/+T7q591rezVyGQlGflORBIL5Q9gBUmJnjzFwFIDV9VQcAcPCi8Rya2bsAMOD50grEdqPT7VUCsT8YSuIm2jWWiahKRNQCMCLNGMDE08F/XQhsN2dimrOQZkqpuVJKLQzicqVZm8XNdre3Eu0aD0fNCX/lDI/BEdKl6SK3AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGHRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgA5ODCA+JvdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MjDsRNUcAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"zombie\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=490 490w,\nhttps://images.ctfassets.net/tushy4jlcik7/2iwB1DjFJYrpNpwdnTvWFP/88cfe34e3186e4809c377ce3ee5ba2a2/zombie.png?w=980 980w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>여기까지는 일반적인 상황입니다. 만약 예기치 못한 상황으로 인해 프로세스가 종료되면 어떻게 될까요? bash(PID 5) 프로세스가 종료된다고 가정해보겠습니다. 5번은 이제 <strong>좀비 프로세스</strong>로 변합니다.</p>\n<p>왜 이런 일이 발생할까요? Unix는 부모 프로세스가 종료 상태를 수집하기 위해 자식 프로세스 종료를 명시적으로 대기하는 방식으로 설계되었기 때문입니다. 좀비 프로세스는 부모 프로세스가 시스템 호출의 <code class=\"language-text\">waitpid()</code> 시스템 명령을 수행할 때까지 존재합니다. 좀비를 제거하기 위해 자식 프로세스에서 <code class=\"language-text\">waitpid()</code>를 호출하는 작업을 <strong>reaping</strong>이라고 합니다.</p>\n<p>대부분의 경우 이러한 상황이 큰 문제가 되지 않습니다. 많은 어플리케이션이 자식 프로세스를 올바르게 가져옵니다. sshd를 사용하는 위의 예시에서 bash가 종료되면 운영 체제는 <code class=\"language-text\">SIGCHLD</code> 신호를 sshd에 보내 깨우게 합니다. sshd는 신호를 통해 인지하고 자식 프로세스를 거둡니다.</p>\n<p>하지만 부모 프로세스가 의도적으로 종료되거나 사용자가 프로세스를 종료시켰다고 가정해보겠습니다. 그러면 그 자식 프로세스들은 어떻게 될까요? 더 이상 상위 프로세스가 없으므로 **고아 상태(orphaned)**가 됩니다.</p>\n<p>init 프로세스는 이를 해결하기 위한 작업을 수행합니다. 바로 <strong>고아 상태가 된 자식 프로세스를 거두는 것(adopt)</strong> 입니다. init 프로세스에 의해 생성된 적이 없지만 프로세스의 부모가 되어 좀비 프로세스가 되지 않도록 정리해주는 역할을 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 65.2014652014652%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAaCAMAAADyku75AAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAP9QTFRF////+/v7+vr69/f35eXl7Ozs9PT08vLy3d3d7e3t1dXV6urq6Ojo/Pz8/v7+5ubm8fHx6enp+fn5+Pj44+Pj9vb21NTU4uLi4eHh8PDw7u7u1tbW5+fn39/f09PT3t7e4ODg2trat7e329vby8vL19fX5OTk9fX1zMzMxsbGzc3N/f398/PzyMjI3NzcwcHBx8fH0dHRxMTE2dnZvb29/Pjx+fPn8uzgzsi7z8m9ysS31M7C/fv20tLS9uXL+uTL7uLOzs7O9ubN++bP+eTN897I8NzG+eTO0NDQ5tO+w7Ohyrmn4c651MOv7trEycnJxcXFw8PD8+rb6dzH8OrfZkNvDQAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAoFFL7if9kAAAFgSURBVDjLtZJpV4JAFIZHyAFCFMiEEhQrA5eysmwlKVpsX///b+nCXBDTyi+958zow31m5swFQuZPbgK4LPET4kKehUYgiAykuLSIJbZaxgUFJQPFEkySkuwVz3lCqKASoukMlqgK/8oMcgJdZhBjxTDHYkE0V1JxtSpbGZEdrWeAGN8BBNu2azDEIgBFqMOmRHGQrPTm6dop+I1+KjUgazDW4z5qmrZRhomfIeJvM7rMpoups4ea12qPxU6uqKqJSAUqyV1XxMbzJX4s1rbK9nYimr2d6q6ciH8fPUNseZ7Xg7EXfUalPsaaFqdpvj4qedWlM0um4zj7MOIXejA4PDo+OR0MzgBcB0tMrugsfnSZ8yEmAOhjRb9Ibt0hcFp868swvAqvb27DAPvR4bocGaHot4xmIxHv7h8en55RpC9tw5dSMdNH2JElyFRQfPVY3qI+vn9gPgEsrHgj8g/5AstAMF/bQC0SAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDky+FIq4QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzEyKKWNxAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"adopted\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=273 273w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=546 546w,\nhttps://images.ctfassets.net/tushy4jlcik7/3jR6W6RtoYEMOVbsaytJWr/a4d815b4a092d1695606fd1978b9d8d4/adopted.png?w=1092 1092w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>백그라운드에서 실행되는 nginx 프로세스를 예시로 들어보겠습니다. 먼저 nginx는 자식 프로세스를 만듭니다. 그리고 nginx 프로세스가 종료됩니다. 고아가 된 nginx 자식 프로세스는 init 프로세스가 거두어들입니다.</p>\n<p>이러한 init 프로세스의 역할 덕분에 우리는 어플리케이션을 개발할 때 크게 신경쓰지 않게 되었습니다. 하지만 쿠버네티스를 포함한 컨테이너 환경의 경우, 조금 다릅니다.</p>\n<br>\n<h2 id=\"컨테이너-내부에서의-프로세스-동작\" style=\"position:relative;\"><a href=\"#%EC%BB%A8%ED%85%8C%EC%9D%B4%EB%84%88-%EB%82%B4%EB%B6%80%EC%97%90%EC%84%9C%EC%9D%98-%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4-%EB%8F%99%EC%9E%91\" aria-label=\"컨테이너 내부에서의 프로세스 동작 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>컨테이너 내부에서의 프로세스 동작</h2>\n<p>도커는 컨테이너 ENTRYPOINT(CMD)로 명시된 프로세스를 PID 1로써 새로운 PID 네임스페이스에 정의합니다. 그리고 컨테이너 내부에 있는 PID 1 프로세스에만 신호를 보내 종료할 수 있습니다. 이러한 이유로 컨테이너는 경량화 이미지를 기반으로 단일 프로세스만 실행하는 경우가 많습니다. 두 가지 예시를 살펴보겠습니다.</p>\n<p><strong>1. sh 프로세스가 PID 1인 경우</strong><br>\nDockerfile을 통해 다음과 같은 컨테이너 명령을 지정하면 실행을 위해 쉘에 전달됩니다. 그 결과 아래와 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - /bin/sh (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>쉘을 PID 1로 사용하면 실제로 2번 프로세스에 signal를 보내는 것이 거의 불가능합니다. 쉘로 보낸 신호는 하위 프로세스로 전달되지 않으며 프로세스가 완료될 때까지 셸이 종료되지 않습니다. 이 경우 컨테이너를 종료하기 위해 SIGKILL을 보내야 합니다.</p>\n<p><strong>2. 내 프로세스가 PID 1인 경우</strong><br>\nDockerfile에서 다음과 같이 정의하면 프로세스가 즉시 시작되고 컨테이너의 초기화 시스템으로써 작동하여 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - python my_server.py (PID 1, inside container)</code></pre></div>\n<p>이러한 구조가 1번 예시보다 나은 방법입니다. 프로세스는 이제 실제로 보내는 신호를 수신합니다. 그러나 PID 1이므로 예상대로 응답하지 않을 수 있습니다.</p>\n<br>\n<h2 id=\"pid-1의-signal-propagation-문제\" style=\"position:relative;\"><a href=\"#pid-1%EC%9D%98-signal-propagation-%EB%AC%B8%EC%A0%9C\" aria-label=\"pid 1의 signal propagation 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>PID 1의 Signal Propagation 문제</h2>\n<p>컨테이너 환경도 마찬가지로 PID 1은 초기화 시스템의 책임이 있습니다.\n일반적인 프로세스는 <code class=\"language-text\">TERM</code>에 대한 자체 handler를 등록하여 종료하기 전 cleanup을 수행할 수 있습니다. 프로세스가 signal handler를 등록하지 않은 경우, 커널은 일반적으로 <code class=\"language-text\">TERM</code> 신호에 대한 기본 동작인 프로세스 종료를 수행합니다.</p>\n<p>반면 PID 1은 <code class=\"language-text\">TERM</code> 신호에 대해 기본 동작으로 실행되지 않습니다. 따라서 signal handler를 등록하지 않은 경우, <code class=\"language-text\">TERM</code>은 프로세스에 아무런 영향도 미치지 못합니다.\n만약 자식 프로세스가 하위 프로세스를 생성하고 먼저 죽었다면, 컨테이너 상에 좀비 프로세스가 계속 쌓일 수 있습니다.</p>\n<p>docker run이 <code class=\"language-text\">SIGTERM</code>을 수신하면 컨테이너 자체가 죽지 않더라도 신호를 컨테이너로 전달한 다음 종료됩니다. docker stop 명령을 사용해도 마찬가지입니다. <code class=\"language-text\">TERM</code> signal을 보내고 10초 동안 기다린 다음 프로세스가 여전히 중지되지 않으면 KILL이 전송되어 정리할 기회 없이 즉시 중지됩니다.</p>\n<br>\n<h2 id=\"dumb-init\" style=\"position:relative;\"><a href=\"#dumb-init\" aria-label=\"dumb init permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>dumb-init</h2>\n<p>dumb-init은 이러한 문제를 해결하고 컨테이너를 일반 프로세스와 같은 형태로 사용할 수 있도록 지원하기 위해 만들어졌습니다. systemd과 달리 컨테이너에서 사용하기 위해 경량화된 형태로 개발된 초기화 시스템입니다. dumb-init을 사용하면 다음과 같은 프로세스 트리가 생성됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">- docker run (on the host machine)\n  - dumb-init (PID 1, inside container)\n    - python my_server.py (PID 2, inside container)</code></pre></div>\n<p>dumb-init은 모든 signal에 대해 signal handler를 등록하고 해당 signal을 프로세스 세션으로 전달합니다. 파이썬 프로세스는 더 이상 PID 1로 실행되지 않기 때문에 dumb-init이 <code class=\"language-text\">TERM</code>과 같은 신호를 전달할 때 handler를 등록하지 않아도 프로세스 종료가 가능합니다. dumb-init은 signal propagation 뿐만 아니라 고아 상태가 된 자식 프로세스를 거두는 역할(adopt)도 수행합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"docker\"><pre class=\"language-docker\"><code class=\"language-docker\"><span class=\"token instruction\"><span class=\"token keyword\">RUN</span> apt install dumb-init</span>\n<span class=\"token instruction\"><span class=\"token keyword\">ENTRYPOINT</span> [<span class=\"token string\">\"/usr/bin/dumb-init\"</span>, <span class=\"token string\">\"--\"</span>, <span class=\"token string\">\"/my/script\"</span>]</span></code></pre></div>\n<p>사용 방법은 정말 간단합니다. 이미지에 바이너리를 설치하고 명령어 실행할 때 추가하면 됩니다.</p>\n<br>\n<h2 id=\"airflow-이미지에서-dumb-init-사용\" style=\"position:relative;\"><a href=\"#airflow-%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%97%90%EC%84%9C-dumb-init-%EC%82%AC%EC%9A%A9\" aria-label=\"airflow 이미지에서 dumb init 사용 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Airflow 이미지에서 dumb-init 사용</h2>\n<p>Airflow도 dumb-init를 ENTRYPOINT에서 사용하고 있습니다. webserver, worker, scheduler pod에서 <code class=\"language-text\">bash -c ENTRYPOINT</code>를 사용하는데 bash는 자식에게 signal을 전달 안하기 때문에 dumb-init 사용이 필요합니다. 컨테이너 내에서는 환경변수를 통해 다르게 설정할 수 있도록 지원하고 있습니다. 설정 값의 차이는 아래와 같습니다.</p>\n<ul>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=1</code> : 메인 프로세스 그룹의 모든 프로세스에 SIGNAL 전파</li>\n<li><code class=\"language-text\">DUMB_INIT_SETSID=0</code> : 메인 프로세스에만 SIGNAL 전파</li>\n</ul>\n<p>공식 차트에서 worker pod은 0으로 나머지는 1로 설정되어 있습니다.<br>\n이유는 Celery Worker의 warm shutdown을 지원하기 위해서 입니다. 특히 Airflow on Kubernetes 구성에서 CeleryExecutor를 사용하는 경우, task의 정상적인 종료를 위해 필요합니다. 이 부분은 다음 포스트에 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/\">https://blog.phusion.nl/2015/01/20/docker-and-the-pid-1-zombie-reaping-problem/</a></li>\n<li><a href=\"https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html\">https://engineeringblog.yelp.com/2016/01/dumb-init-an-init-for-docker.html</a></li>\n<li><a href=\"https://github.com/Yelp/dumb-init\">https://github.com/Yelp/dumb-init</a></li>\n<li><a href=\"https://airflow.apache.org/docs/docker-stack/entrypoint.html\">https://airflow.apache.org/docs/docker-stack/entrypoint.html</a></li>\n</ul>","excerpt":"쿠버네티스 기반의 데이터플랫폼을 운영하다보면 이미지의 에 , 과 같은 명령어를 사용하는 경우가 많습니다. 예를 들어 Airflow에서는 dumb…"}}},{"id":"641c0253-f45e-5b70-90a2-43300aece54b","title":"Airflow worker에 KEDA AutoScaler 적용한 후기","slug":"airflow-worker-keda-autoscaler","publishDate":"June 24, 2022","publishDateISO":"2022-06-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>Airflow에서 실행되는 배치 작업들은 특정 시간 또는 야간에 많이 수행되고 이외의 시간은 상대적으로 여유로운 경우가 많습니다. 이러한 상황에서 오토스케일링을 적용한다면 효율적으로 리소스를 최적화하여 사용할 수 있습니다.</p>\n<p>만약 쿠버네티스 위에서 Celery Executor를 사용한다면 worker의 오토스케일링을 위해 KEDA를 고려해볼 수 있습니다. 이 글에서는 Airflow worker에 KEDA AutoScaler를 적용하면서 겪었던 여러 문제들과 해결 과정에 대해 정리해보려 합니다.</p>\n<p><br><br></p>\n<h2 id=\"keda-autoscaler\" style=\"position:relative;\"><a href=\"#keda-autoscaler\" aria-label=\"keda autoscaler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KEDA AutoScaler</h2>\n<p>KEDA는 쿠버네티스에서 이벤트 기반 오토스케일링을 쉽게 구현할 수 있도록 지원하는 컴포넌트입니다. 쿠버네티스의 HPA와 함께 동작하며 다양한 built-in scaler를 통해 유연하게 오토스케일링 조건을 설정할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.07692307692307%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAaRQTFRF////5e36/v//5+77/P3/6vD7+fv+4eHy4ODy6+v3pL/unLrtd6Dm/v7+or7ulbTreaHm/f3/v9LzoLztkLHr8fX819fX0NDQ4uLiurvis7Pfu7viz8/rg6jo7vP8e6Ln7O7x7+/v2tracpzlmrjsXo7h3eTwlrTo2uX4us7yydfu3t7e39/xs7Tfxsbn2OT4jK7qvtLz3+j5gqforcXw6/H7h6rpn7zt2trvvr/k1tbu1tbWycnJyMjIwsLC0dHR9/f3x8fH09PT0tLS4+Pj8PDwxMTE5OXnzdDTy83R7+/w2dnZ/Pz87Ozs7u7u7e3t4eHh1dXV8/Pz5OTk6enp9PT04uv6fKPn/f392NjY+/v729vbw8PDssnxeqHmcJrk9PX19fX1+vz+obzsxNPv9PT1nbnrm7jsx9bvzdrwm7jr8PH1o77rm7nsv9Du+vr62OHyus/y3Ob4nbrrnbnq3ef5x9j1y9jw5+z0rMTwnrvs9vb28vP1gqfndp/mwNHvytjwc53lfqTm7/H1iqzos8jt5eXl8fHxwMDA3d3dxcXFwcHBGeskdgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAAEbSURBVCjPY2AgCTAyQWhmFgjNygaXYufg4IRzuLh5QBQvH7+AIIgWEhYRZWAQE5cAciSlpGXgCmXl5BUUFRWVlFVU1YC0mLqGppYiBGjL6OjqwRXqGxiCaSNjEzBtamYOl7PgsLSCsa1tbO3sgbSDo5OzC0jA1c0ZrtDdw9MLt+cUkdjePnhCwReJ7YdN3s/P3w8EAnjxKwwMUgyGSIa4huJRGBYuHAEBkVFQRgRQYXSMK5rC2Lj4hEQ0EIHNxKTklMTUtPSMxEyVrOzEnNw8XAoZ8hMTCwqLihNLSsvKKyo1qoAKq3EprKmtq09saGxqTmwRaAUqbPNrx64wscNNO7Gzqzs0McYxEmw1Aw6FGJ7BBiJ8MAAvA6kAAOHsU/o0sJs6AAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY0kiTvqQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODAw1OyalAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIy5LS/nAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-keda\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=416 416w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=832 832w,\nhttps://images.ctfassets.net/tushy4jlcik7/5v0EAf3FxklgutMcsnCGeh/f685150270ae27673be6470db82314c5/keda.png?w=1664 1664w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>만약 Airflow에 적용한다면 위의 그림과 같은 형태로 구성됩니다.\n사용자는 KEDA의 <code class=\"language-text\">ScaledObject</code> CRD를 생성하여 클러스터에 배포합니다.\nKEDA는 쿠버네티스의 API Server와 통신하며 Operator와 같은 형태로써 컨트롤 루프에 따라 동작합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">apiVersion</span><span class=\"token punctuation\">:</span> keda.sh/v1alpha1\n<span class=\"token key atrule\">kind</span><span class=\"token punctuation\">:</span> ScaledObject\n<span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n<span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleTargetRef</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> airflow<span class=\"token punctuation\">-</span>worker\n  <span class=\"token key atrule\">pollingInterval</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">cooldownPeriod</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n  <span class=\"token key atrule\">minReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">3</span>\n  <span class=\"token key atrule\">maxReplicaCount</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n  <span class=\"token key atrule\">triggers</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> postgresql\n      <span class=\"token key atrule\">metadata</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">connectionFromEnv</span><span class=\"token punctuation\">:</span> AIRFLOW_CONN_AIRFLOW_DB\n        <span class=\"token key atrule\">query</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"\"</span></code></pre></div>\n<p><code class=\"language-text\">ScaledObject</code>는 위와 같이 무엇을 기준으로 트리거할지, 스케일링 정책 등을 정의할 수 있습니다. KEDA는 <code class=\"language-text\">minReplicaCount</code>에 따라 다르게 동작하는데 <code class=\"language-text\">minReplicaCount</code>가 0인 경우, KEDA가 trigger 지표를 통해 직접 처리하지만 1 이상인 경우에는 KEDA가 Metrics Server에 전달만하고 HPA를 통해 처리됩니다. 각 옵션에 대한 자세한 설명은 <a href=\"https://keda.sh/docs/2.7/concepts/scaling-deployments/\">공식 문서</a>에서 확인할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">SELECT</span> ceil<span class=\"token punctuation\">(</span><span class=\"token function\">COUNT</span><span class=\"token punctuation\">(</span><span class=\"token operator\">*</span><span class=\"token punctuation\">)</span>::<span class=\"token keyword\">decimal</span> <span class=\"token operator\">/</span> {{ celery<span class=\"token punctuation\">.</span>worker_concurrency }}<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">FROM</span> task_instance\n<span class=\"token keyword\">WHERE</span> state<span class=\"token operator\">=</span><span class=\"token string\">'running'</span> <span class=\"token operator\">OR</span> state<span class=\"token operator\">=</span><span class=\"token string\">'queued'</span></code></pre></div>\n<p>Airflow에서 사용하는 <code class=\"language-text\">ScaledObject</code>의 트리거 쿼리는 위와 같이<code class=\"language-text\">celery.worker_concurrency</code> 설정을 기준으로 하고 있습니다. 예를 들어 concurrency 설정이 12이며 running 또는 queued 상태의 task instance가 10에서 23으로 증가한 상황이라고 가정해보겠습니다. desired state가 1에서 2로 변경되었기 때문에 deployment의 replica 수는 2로 확장 됩니다. 스케줄이 모두 종료된 이후 다시 task instance가 10으로 줄어들면 replica 수는 1로 축소 됩니다.</p>\n<p>Airflow 공식 차트에서는 KEDA 관련 옵션을 지원하고 있기 때문에 <a href=\"https://airflow.apache.org/docs/helm-chart/stable/keda.html\">공식 문서</a>를 통해 쉽게 적용할 수 있습니다.<br>\n하지만 문제는 적용한 이후에 발생했습니다.</p>\n<br>\n<h2 id=\"적용-후에-발생한-문제\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EC%97%90-%EB%B0%9C%EC%83%9D%ED%95%9C-%EB%AC%B8%EC%A0%9C\" aria-label=\"적용 후에 발생한 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후에 발생한 문제</h2>\n<p>적용 후에 실행 중인 task의 로그가 갑자기 끊기면서 강제로 실패 처리되는 문제가 있었습니다.<br>\n시간을 보니 worker가 Scale-In 되는 시점에 발생했고 크게 두 가지 문제를 확인할 수 있었습니다.</p>\n<br>\n<h3 id=\"1-hpa의-replica-flapping-문제\" style=\"position:relative;\"><a href=\"#1-hpa%EC%9D%98-replica-flapping-%EB%AC%B8%EC%A0%9C\" aria-label=\"1 hpa의 replica flapping 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. HPA의 replica flapping 문제</h3>\n<p>먼저 의도한 것보다 Scale-In/Out이 너무 빈번하게 발생했습니다.\n새로 노드가 뜨는데 시간이 소요되므로 배치가 많은 시간 대에도 잦은 스케일 조정이 발생하는 것은 비효율적입니다. 이러한 문제를 HPA에서는 <strong>replica flapping</strong> 이라고 말합니다.\nHPA는 이를 제어하기 위해 <strong>안정화 윈도우와 스케일링 정책</strong>을 지원하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">stabilizationWindowSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span></code></pre></div>\n<p>위와 같이 <code class=\"language-text\">stabilizationWindowSeconds</code> 설정을 600으로 설정하면 이전 10분 동안의 모든 목표 상태를 고려해서 가장 높은 값으로 설정합니다. 현재 시점에 scaleDown 조건을 만족하더라도 즉시 수행되는게 아니라 10분이 지난 시점에 scaleDown이 수행됩니다. 이를 통해 잦은 스케일 조정을 제한할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">behavior</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">scaleDown</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">policies</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> Pods\n      <span class=\"token key atrule\">value</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">periodSeconds</span><span class=\"token punctuation\">:</span> <span class=\"token number\">300</span></code></pre></div>\n<p><code class=\"language-text\">scaleDown.polices</code>를 통해 Scale-In 발생 시 replica 변경 허용에 대한 정책을 지정할 수 있습니다. 위의 예시는 5분 내에 최대 1개의 replica를 scaleDown 하도록 허용하는 정책입니다. 이를 통해 계단식으로 천천히 pod를 축소할 수 있습니다.</p>\n<p>현재 Airflow 공식 차트에서는 KEDA의 advanced 옵션을 지원하지 않아 <a href=\"https://github.com/apache/airflow/pull/24220\">PR</a>을 추가했습니다.<br>\n차트 1.7 버전부터 사용하실 수 있습니다.</p>\n<br>\n<h3 id=\"2-worker-warm-shutdown-문제\" style=\"position:relative;\"><a href=\"#2-worker-warm-shutdown-%EB%AC%B8%EC%A0%9C\" aria-label=\"2 worker warm shutdown 문제 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. Worker Warm Shutdown 문제</h3>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 45.31001589825119%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAMAAAAewWyUAAACvlBMVEXh0tbKvcDAs7bLv8Lg0tb+/v7e3rvq6ub////r697c3MLs4eXe0dTf1tne1Nff19nDvb/Lxsfg2tz28fLiz7na0a/b0q/e1bLVxLLn5+fNzbfX19Tv7+/a2tLJybnp6ens3NPb07De1rLc1LHUyb7d0b/c1LDf1rLa0a7d1LHQx8Ld3d318PLc1tjX19fTys3FxcXHwsT4+Pj9+fv++/zp5ObW09Ta2tra1dbSztDb29vVyc3LxcfNw8b17/Hu3uPr5ujc2drk3+DVz9HXzdDKxcfMwsX48/Xt3uP38vT59Pb47fH9+frf2dvr3OHl3eDi3N7v6uv78/X89/np3+Lb1tja09Xj2tzc2trz6+7y7e/x6+378/bb09XeytHNxsjQ0NDY2Nji18ng2Mbg2Mfe18Xi2sjZ1NLj3N7RxsrW0dPY09TYzdDXy77VzbvQw7TWzrzTy7nUzs3d29zb1NbZz9LFwMLax8fc06/c07Dez6/s5+jW1tba1dfEv8HGxsbj3t/u7u7y8vLTvsXRy83b0dTPxsnLycnMysrQzc7ays/XzdHS0tLPz8/R0dHZ0NPSw8fSz9DQzs7VvsXd3Nz69/jq6urZ1NbMzMzWxsvW0tPV09TX1NXX1dbe1djVztDc2NnJycnOyMrq6Ojr6+v5+fn+/Pzv3uP9+vvq4uXZ09Xi1M3i2szezsPj2Mvezsnn5ebm4ePn5OXu7Ozm4+Tj4OHt4d/h2czh2Mrk3M7c1tHf19Dj2czd08ba1dPi2M7g2Mvi2cvh2cva1tXd2djg18rj2Mzz7e/Zyr7NxbHPx7PPwLf8/Pzd3brp6eXq6t3b28Ho29fOxrPRybXNxbLRycPXzsTSyrbOxrLQycfVyrrLw7DQyLTSzMvd19XPw7Lu6ern3+Ll4OHn3uHl5c7u7uvy8urg4M/w6uz48/TEJqqHAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0021Ul1QAAAWRJREFUGBl9wb9LlHEAwOHPp/vK6Z2nR/hyXCZRIS3aoEMtDbeE5tCvobmaW6KlsTVqC/oXgkChFqG1ycXBq6GOUKLy3oJ4q/POMOnVwzuVw+cRO7YhI+g2kFHZY4MwYledyC66rBHK7noHE1WINvtbAzRzNgYTDghfykVTtOU38o0/kPNXwkEBBkxV1CpHCPAvPvPmsqk5MHIEOPaDwwKUYsjrz+NNUtkWkD05hm1vaQvs+liFiSpc/D75Hrhkx4zAIgR6+eA6qSsuM6XzN68+JUCd/ep0fV6Br9e9pQ8NHGWYhIXx6WSxRqCnSuvV9BKT59XlKV8IAUox+5TmFC3cdbU05HNSK6QCHbcf34nc8wSI6zEdAWZmnS2Yil4/cOHGI6Akh/nSjrX7zLsjKbrVd++Z2sy5Xv52wgphTDF1YclrGUbdMVz4PSSjm/1u9VncODcouCY4XvPsJ0/D6l96yZ7iP7HRV+FnpNfiAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"airflow-celery-process\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=315 315w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=629 629w,\nhttps://images.ctfassets.net/tushy4jlcik7/33ZVE8mMGalogVwLdLgVAe/0da47cecb895c983711f2fbb45ea5c80/celery.png?w=1258 1258w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>celery worker의 warm shutdown이 제대로 이루어지지 않았기 때문에 task의 로그가 갑자기 끊기면서 강제로 실패 했습니다. Airflow의 CeleryExecutor는 위와 같이 여러 프로세스를 통해 수행됩니다. 이 때 실제로 task를 실행하는 프로세스는 main 프로세스가 아니라 subprocess 입니다. celery에서는 실행 중인 task가 처리된 이후에 종료할 수 있도록 <strong>warm shutdown</strong>을 지원하고 있습니다. worker의 main process가 <code class=\"language-text\">SIGTERM</code>을 받으면 task가 종료될때까지 기다리게 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># warm shutdown log\nworker: Warm shutdown (MainProcess)\n\n -------------- celery@fcd56490a11f v4.4.7 (cliffs)\n--- ***** -----\n-- ******* ---- Linux-5.4.0-1045-aws-x86_64-with-debian-10.8\n- *** --- * ---\n- ** ---------- [config]\n- ** ---------- .> app:         airflow.executors.celery_executor:0x7f95\n- ** ---------- .> transport:   redis://redis:6379/0\n- ** ---------- .> results:     postgresql://airflow:**@postgres/airflow\n- *** --- * --- .> concurrency: 16 (prefork)\n-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)\n--- ***** -----\n -------------- [queues]\n                .> default          exchange=default(direct) key=default\n\n[tasks]\n  . airflow.executors.celery_executor.execute_command</code></pre></div>\n<p><a href=\"https://swalloow.github.io/container-tini-dumb-init/\">이전 글</a>에서 설명한 것처럼 Airflow 공식 차트에서 worker pod은 <code class=\"language-text\">DUMB_INIT_SETSID=0</code>으로 이미 설정되어 있기 때문에 메인 프로세스에만 SIGNAL이 전파되고 task process는 계속 실행됩니다. 하지만\n<strong>scaleDown이 발생한다면, 실행 중이던 worker pod이 종료되기 때문에 pod 내에 있던 task process도 함께 강제 종료되면서 task가 실패</strong>하게 됩니다. 장시간 수행되는 task 일수록 이러한 문제를 마주칠 가능성이 높습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.582763337893304%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAARASURBVEjHvVVNbxtVFD33vTcz9thOxolbuyklSZNC1YbSQpG6qKruYIMESMCGBX+ADSvgH7BE6gIhIbHmDyBVSHyjtgtaUZqU9CtS2jRpk9iJHdvjmXcvi9hTOzitw4K7mjtv7jtzzz3vPLpz8+r8/G10olAYfWnmGHaPG7Nzjx6vBsPDp06ewACxtPTw71u3AZw/d/anX34TFgDT04fN8vLK7M35arXm+6koig9PTjwd+PadhQcPloJgUOD7D5bm5uYrjx6fPf3KlV8vKa1MOp1Op6m5uQwACvfrNgwjx3MVqYM+qd33ErakNAYOjsKovCHlTbDQaM4M55VxTXuR0Ix5rbJhmYMgn/PSinbWDyVYBBD2EAT+/Vr85bcQ6A/fdN55A0AH2GI650znitvZbJ3uLSy0wtDPZKIoAjAxOXk8zZ2ORWkZHFcs7PeX0h+8i5TX+O6ivPU6JcBkCF3kHh+W4y+P99Al8sPi1vraOgH7i8VzY2YPDQupmenw4o8A1MkpMgSgM+MBqIvlyYwvLW3Wt2osks+PnCllnzXjVrxe4atzsFa9eszkR5TrdoA1iAadG7PdYA1ARABsRn0Ka5tVZs4NDZEisZbDVkJ8Kef5Whn8p2hPmwiCStwHeK3eEuYoLVorEQ3tBba5DUyQLnExBAPrhWWx0Qdso1JeX1vbt7+YzeUK+wom+URE2B6IagQBxFgDrTvi0j3ieoZKmcKtLlZrtc1KpVatHjl6dGwoDyBkBA5ezLU74VYUlSswbSmRQZe4dvhiQ91bWIijaGJqesYX09ueiCXak4G04nIlqTZBoFyvv7hqDOkQvxqiWq01Gg2llIiMFgojxua9PTtXQpcT5EknztU732yXN9WITSad1iTMRJRSaDKttHbonEHU9rR/nQ4TUzbZXyCCJwYC2VVcRYfJ0/D9pHQ1onKr5+OVpeUwbGptojhSRM9PTnavOkxa2gwpkJGuGe9wrqdfCfFft+7+fNmyjZmj2KZcJ45tM4pcxzhaK1IsbJkPBMGQ7wOoj4xeOTjeaDQIOHKodDQLUh2qJd71LIkIqHfVcUuHxuph2GxFrjFaKcssgCJopQFYZkXkp1JkNIBMSp/PCrIpAGhWxBsmr0P1hS8+v37tj/7AEAJNTL3gOO72/LxUutmoh81GNjdkrRWRKGq5rgeQtfFGZf3xysPeX2exNkk/+vizE6dOt6meu3G9vL7aF/jrry7U61vbNgXAcT3fz5BSBAJg45iFtTZaa4FopZm5Ul6zXUgjQf69t99P0pnXzowWS+2OC+NeZiyT3LbdcfhU0Gi4Seq63mShlGVhZm0METEzgDiOiJTWWim1skxxFHUkgsAfPv1chkORlnAoZnERxVK748t3v7k++ycpaE3GpZGi85RzOWXVoZA4FAmFQ0l25Fb7jYTg1vaDSCQ75OMeKB385NP+zvU/xD+8Ki/eYcJqYQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQ2MnjDnvIAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5OACp7tIAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMuS0v5wAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"graceful\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=366 366w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=731 731w,\nhttps://images.ctfassets.net/tushy4jlcik7/4UnqkRzmJ35aImCmuwG3EC/9fe7eabfba51e59f7879ba8fd74e3f38/graceful.png?w=1462 1462w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이를 해결하기 위해 task의 execution_timeout 시간까지 pod가 종료되지 않도록 <code class=\"language-text\">terminationGracePeriodSeconds</code>를 지정해주었습니다. 이제 각 컨테이너 내부의 프로세스 1에 <code class=\"language-text\">SIGTERM</code>이 전달되더라도 pod의 graceful shutdown 시간 동안 대기하므로 task process는 계속 실행됩니다. 시간이 모두 지나면 <code class=\"language-text\">SIGKILL</code>을 통해 모든 프로세스가 종료되고 pod도 삭제됩니다.</p>\n<br>\n<h2 id=\"적용-후기\" style=\"position:relative;\"><a href=\"#%EC%A0%81%EC%9A%A9-%ED%9B%84%EA%B8%B0\" aria-label=\"적용 후기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>적용 후기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 22.640117994100294%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAJCAMAAAB30J7MAAAMYWlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AKhSAm9CdKrlBBaBAGpgqiEJJBQYkwIKnZ0UcG1iyhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zczf86c+U/JzL13ANDs5UokeagWAPniAml8RAhzbGoak/QUoIAA9GHvyuXJJKy4uGgAZXD8u7y/ARDFeNVJwfXP+f8qOnyBjAcAkg5xJl/Gy4e4GQB8PU8iLQCAqNBbTimQKPAciHWlMECIVylwthLvVOBMJW4asEmMZ0N8GQA1KpcrzQZA4x7UMwt52ZBH4zPELmK+SAyA5nCIA3lCLh9iRezD8/MnKXAFxHbQXgIxjAf4ZH7Hmf03/swhfi43ewgr8xoQtVCRTJLHnfZ/luZ/S36efNCHDWxUoTQyXpE/rOGt3ElRCkyFuEucGROrqDXEvSK+su4AoBShPDJJaY8a82RsWD/AgNiFzw2NgtgY4nBxXky0Sp+ZJQrnQAx3CzpVVMBJhNgA4oUCWViCymazdFK8yhdalyVls1T6s1zpgF+Frwfy3CSWiv+NUMBR8WMaRcLEFIgpEFsVipJjINaA2FmWmxClshlZJGTHDNpI5fGK+K0gjheII0KU/FhhljQ8XmVfmi8bzBfbLBRxYlR4f4EwMVJZH+wkjzsQP8wFuywQs5IGeQSysdGDufAFoWHK3LHnAnFSgoqnV1IQEq9ci1MkeXEqe9xCkBeh0FtA7CErTFCtxZML4OZU8uNZkoK4RGWceFEOd1ScMh58GYgGbBAKmEAOWyaYBHKAqLWrvgv+Us6EAy6QgmwgAE4qzeCKlIEZMewTQBH4EyIBkA2tCxmYFYBCqP8ypFX2TiBrYLZwYEUueApxPogCefC3fGCVeMhbMngCNaJ/eOfCxoPx5sGmmP/3+kHtNw0LaqJVGvmgR6bmoCUxjBhKjCSGE+1xIzwQ98ejYR8Mmxvug/sO5vHNnvCU0EZ4RLhOaCfcnigqlv4Q5WjQDvnDVbXI/L4WuA3k9MRD8ADIDplxBm4EnHAP6IeFB0HPnlDLVsWtqArzB+6/ZfDdv6GyI7uQUbI+OZhs9+NKDQcNzyEWRa2/r48y1syherOHZn70z/6u+nw4Rv1oiS3EDmBnsOPYOawJqwdM7BjWgF3Ejijw0O56MrC7Br3FD8STC3lE//DHVflUVFLmUuPS6fJZOVcgmFqgOHjsSZJpUlG2sIDJgm8HAZMj5jkPZ7q5uLkBoHjXKB9fbxkD7xCEcf6bbh484wHi/v7+pm+6qE8AHDSHx7/9m872CnxMwOf02eU8ubRQqcMVHQE+JTThSTMEpsAS2MF83IAX8AfBIAyMArEgEaSCCbDKQrjPpWAKmAHmghJQBpaB1WAd2AS2gp1gD9gP6kETOA5OgwvgMrgO7sLd0wFegm7wHvQhCEJCaAgdMUTMEGvEEXFDfJBAJAyJRuKRVCQDyUbEiByZgcxDypAVyDpkC1KN/IocRo4j55A25DbyEOlE3iCfUAylorqoCWqDjkB9UBYahSai49FsdDJahM5Hl6AVaBW6G61Dj6MX0OtoO/oS7cEApo4xMHPMCfPB2FgsloZlYVJsFlaKlWNVWC3WCP/nq1g71oV9xIk4HWfiTnAHR+JJOA+fjM/CF+Pr8J14HX4Sv4o/xLvxrwQawZjgSPAjcAhjCdmEKYQSQjlhO+EQ4RQ8Sx2E90QikUG0JXrDs5hKzCFOJy4mbiDuJTYT24iPiT0kEsmQ5EgKIMWSuKQCUglpLWk36RjpCqmD1Kumrmam5qYWrpamJlYrVitX26V2VO2K2jO1PrIW2ZrsR44l88nTyEvJ28iN5EvkDnIfRZtiSwmgJFJyKHMpFZRayinKPcpbdXV1C3Vf9THqIvU56hXq+9TPqj9U/0jVoTpQ2dR0qpy6hLqD2ky9TX1Lo9FsaMG0NFoBbQmtmnaC9oDWq0HXcNbgaPA1ZmtUatRpXNF4pUnWtNZkaU7QLNIs1zygeUmzS4usZaPF1uJqzdKq1DqsdVOrR5uu7aodq52vvVh7l/Y57ec6JB0bnTAdvs58na06J3Qe0zG6JZ1N59Hn0bfRT9E7dIm6troc3RzdMt09uq263Xo6eh56yXpT9Sr1jui1MzCGDYPDyGMsZexn3GB80jfRZ+kL9Bfp1+pf0f9gMMwg2EBgUGqw1+C6wSdDpmGYYa7hcsN6w/tGuJGD0RijKUYbjU4ZdQ3THeY/jDesdNj+YXeMUWMH43jj6cZbjS8a95iYmkSYSEzWmpww6TJlmAab5piuMj1q2mlGNws0E5mtMjtm9oKpx2Qx85gVzJPMbnNj80hzufkW81bzPgtbiySLYou9FvctKZY+llmWqyxbLLutzKxGW82wqrG6Y0229rEWWq+xPmP9wcbWJsVmgU29zXNbA1uObZFtje09O5pdkN1kuyq7a/ZEex/7XPsN9pcdUAdPB6FDpcMlR9TRy1HkuMGxbThhuO9w8fCq4TedqE4sp0KnGqeHzgznaOdi53rnVyOsRqSNWD7izIivLp4ueS7bXO666riOci12bXR94+bgxnOrdLvmTnMPd5/t3uD+2sPRQ+Cx0eOWJ91ztOcCzxbPL17eXlKvWq9ObyvvDO/13jd9dH3ifBb7nPUl+Ib4zvZt8v3o5+VX4Lff7y9/J/9c/13+z0fajhSM3DbycYBFADdgS0B7IDMwI3BzYHuQeRA3qCroUbBlMD94e/Azlj0rh7Wb9SrEJUQacijkA9uPPZPdHIqFRoSWhraG6YQlha0LexBuEZ4dXhPeHeEZMT2iOZIQGRW5PPImx4TD41Rzukd5j5o56mQUNSohal3Uo2iHaGl042h09KjRK0ffi7GOEcfUx4JYTuzK2PtxtnGT434bQxwTN6ZyzNN41/gZ8WcS6AkTE3YlvE8MSVyaeDfJLkme1JKsmZyeXJ38ISU0ZUVK+9gRY2eOvZBqlCpKbUgjpSWnbU/rGRc2bvW4jnTP9JL0G+Ntx08df26C0YS8CUcmak7kTjyQQchIydiV8Zkby63i9mRyMtdndvPYvDW8l/xg/ip+pyBAsELwLCsga0XW8+yA7JXZncIgYbmwS8QWrRO9zonM2ZTzITc2d0duf15K3t58tfyM/MNiHXGu+OQk00lTJ7VJHCUlkvbJfpNXT+6WRkm3yxDZeFlDgS78qL8ot5P/JH9YGFhYWdg7JXnKganaU8VTL05zmLZo2rOi8KJfpuPTedNbZpjPmDvj4UzWzC2zkFmZs1pmW86eP7tjTsScnXMpc3Pn/l7sUryi+N28lHmN803mz5n/+KeIn2pKNEqkJTcX+C/YtBBfKFrYush90dpFX0v5pefLXMrKyz4v5i0+/7PrzxU/9y/JWtK61GvpxmXEZeJlN5YHLd+5QntF0YrHK0evrFvFXFW66t3qiavPlXuUb1pDWSNf014RXdGw1mrtsrWf1wnXXa8Mqdy73nj9ovUfNvA3XNkYvLF2k8mmsk2fNos239oSsaWuyqaqfCtxa+HWp9uSt535xeeX6u1G28u2f9kh3tG+M37nyWrv6updxruW1qA18prO3em7L+8J3dNQ61S7ZS9jb9k+sE++78WvGb/e2B+1v+WAz4Hag9YH1x+iHyqtQ+qm1XXXC+vbG1Ib2g6POtzS6N946Dfn33Y0mTdVHtE7svQo5ej8o/3Hio71NEuau45nH3/cMrHl7omxJ66dHHOy9VTUqbOnw0+fOMM6c+xswNmmc37nDp/3OV9/wetC3UXPi4d+9/z9UKtXa90l70sNl30vN7aNbDt6JejK8auhV09f41y7cD3metuNpBu3bqbfbL/Fv/X8dt7t13cK7/TdnXOPcK/0vtb98gfGD6r+sP9jb7tX+5GHoQ8vPkp4dPcx7/HLJ7InnzvmP6U9LX9m9qz6udvzps7wzssvxr3oeCl52ddV8qf2n+tf2b06+FfwXxe7x3Z3vJa+7n+z+K3h2x3vPN619MT1PHif/77vQ2mvYe/Ojz4fz3xK+fSsb8pn0ueKL/ZfGr9Gfb3Xn9/fL+FKuQOfAhhsaFYWAG92AEBLBYAO722Uccq74IAgyvvrAAL/CSvviwPiBUAtHBSf8exmAPbBZjMHcsOm+IRPDAaou/tQU4ksy91NyUWFNyFCb3//WxMASI0AfJH29/dt6O//sg0GexuA5snKO6hCiPDOsDlAga4bpPeCH0R5P/0uxx9HoIjAA/w4/gvp7JAEsYT/TAAAARFQTFRFGBoeMDI3LjA1MDE3LzE3FxkdMjQ6LjA2GRsfICInGhwgICEhGx0iGx0hJCsoHSEjMS8kHR4gIyUqJi0pJSwpHyMjHyElHyAgJyciKikjICUkIigmHB4gJiYiHh8gKCciGxwgISIhIiQoJzArJi4qIyknHR8jIyMhKSkjKiojMjAkLy0jIiMhKikiKSkiLy4kHCAiJSwoJy8qHiIjLS4vLy8qLC0tLi8wKCkpKSorLzAwKSkpLCwsLzAxKyspKysrMDEyLCwpJCYpKy0yMDAqJScpIyYpJSgrLTAzJyotKi0wKCsuJSkrKSwvKS0vKCwuKy8yJSgqJiksLjE0JCgqGh0fISQmJCUjJScsIyUpJCcq+8UqbwAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNNtVJdUAAACrSURBVBjTbY/NDsFAFIW/MzOdmZCiJWVhI1ZWnsRz8k7WVlbCAo3Wwl+Vk5ubky/nJufCUzLWPW3yYl7BvJgiPzr/Y06qDJ+xdWVwKpvMg86mdZkEwLeYx2NS+k0YI3C95dl31mPIPSPynCDCiFBPxhT21KyZQQc32E27tU1P/eFxH9OedIns59LgEzwAOBaSMmXScKaHKAtJldV767h1S0laf5dfJdWm/eQdd8QlL5U3TywAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADI3MTIncRmCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA2MTTABELGAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjLktL+cAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"keda-test\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=678 678w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=1356 1356w,\nhttps://images.ctfassets.net/tushy4jlcik7/yDciuDF3UeQ4OfWfhjH13/b36ab4566691366ce8fa68623df4b00d/keda-test.png?w=2712 2712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 문제들을 모두 수정한 이후부터 안정적으로 worker의 확장, 축소가 이루어졌습니다.<br>\n위 그림과 같이 개발 환경에 동시성 테스트를 위한 DAG을 먼저 만들어서 slot 지표에 따라 replica count가 어떻게 변화하는지 확인해본다면 안정적으로 적용할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping\">https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#flapping</a></li>\n<li><a href=\"https://learnk8s.io/graceful-shutdown\">https://learnk8s.io/graceful-shutdown</a></li>\n</ul>","excerpt":"Airflow…"}}},{"id":"ab488772-c7d7-5f01-8241-ce087829c842","title":"JupyterHub에 Tensorboard 연동하기","slug":"jupyterhub-tensorboard","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy 형태로 연동하는 방법에 대해 정리해보려고 합니다. 연동 과정으로 jupyter-server-proxy 라는 extension을 사용합니다.</p>\n<br>\n<h2 id=\"기존-연동-방식\" style=\"position:relative;\"><a href=\"#%EA%B8%B0%EC%A1%B4-%EC%97%B0%EB%8F%99-%EB%B0%A9%EC%8B%9D\" aria-label=\"기존 연동 방식 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>기존 연동 방식</h2>\n<p>Jupyter Notebook에 Tensorboard를 연동하는 가장 쉬운 방법은 공식문서에 나와있는 <strong>%tensorboard</strong> 를 사용하는 방법입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">%load_ext tensorboard\n%tensorboard --logdir logs</code></pre></div>\n<p>이 방법은 간단하지만 노트북 내에서 접근하거나 IP주소:포트번호를 통해 접근하게 됩니다.</p>\n<p>따라서 JupyterHub와 같이 여러 사용자가 쓰는 환경이라면 나의 Tensorboard 프로세스에 어떤 주소를 통해 접근해야 하는지 매번 찾아야 합니다.\n또한 JupyterHub는 인증 과정을 거치는 반면 프로세스로 직접 띄우는 텐서보드는 인증 없이 접근이 가능해집니다.</p>\n<br>\n<h2 id=\"jupyter-server-proxy\" style=\"position:relative;\"><a href=\"#jupyter-server-proxy\" aria-label=\"jupyter server proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-server-proxy</h2>\n<p>jupyter-server-proxy는 외부 웹 서비스의 프록시를 지원하는 extension 입니다.\njupyter-server-proxy를 통해 연동하면 다음과 같은 이점을 가질 수 있습니다.</p>\n<ul>\n<li>tensorboard 프로세스는 JupyterLab Launcher를 통해 생성됩니다</li>\n<li>프록시를 통해 /hub/proxy/ 하위의 주소로 연결되므로 인증이 그대로 사용됩니다</li>\n</ul>\n<br>\n<h2 id=\"jupyter-tensorboard-proxy-설치\" style=\"position:relative;\"><a href=\"#jupyter-tensorboard-proxy-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter tensorboard proxy 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>jupyter-tensorboard-proxy 설치</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># pip install jupyter-tensorboard-proxy</span>\n\n<span class=\"token comment\"># log path</span>\nlog_dir <span class=\"token operator\">=</span> <span class=\"token string\">\"/home/jovyan/logs/\"</span> <span class=\"token operator\">+</span> datetime<span class=\"token punctuation\">.</span>datetime<span class=\"token punctuation\">.</span>now<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>strftime<span class=\"token punctuation\">(</span><span class=\"token string\">\"%Y%m%d-%H%M\"</span><span class=\"token punctuation\">)</span>\ntensorboard_callback <span class=\"token operator\">=</span> tf<span class=\"token punctuation\">.</span>keras<span class=\"token punctuation\">.</span>callbacks<span class=\"token punctuation\">.</span>TensorBoard<span class=\"token punctuation\">(</span>log_dir<span class=\"token operator\">=</span>log_dir<span class=\"token punctuation\">,</span> histogram_freq<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>설치 방법은 아주 간단합니다. singleuser profile 이미지에 위의 패키지만 설치해주면 됩니다. 기본으로 바라보는 로그 경로는 $HOME/logs 입니다. 따라서 tensorflow 코드에서 로그 경로를 연결해주어야 합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.941097724230254%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAMAAAADxFwsAAAK0mlDQ1BpY2MAAEiJlZcHWFNZFoDve+mNlhCKlNCbIJ0AUkIPRXoVlZAEEkqMCUHEjgyO4FgQEcEyoiKIgqMjIGNBLFgYFBWwD8ggoKyDBRsq+4AlzMx+u/vtyXdy/5x37jnn3u/e950AQAnmiMUZsBIAmaIsSYS/FyMuPoGBGwBEoAaowBIYcLhSMSssLBggMjP+Vd53A2hyvGs5Gevfn/9XUeHxpVwAoESEk3lSbibCLYi+4oolWQCgTiB2g+VZ4km+hzBNghSI8NAkp07zl0lOnmK00pRPVIQ3woYA4MkcjiQVALI1Ymdkc1OROOQwhK1FPKEI4XUIu3MFHB7CSF4wNzNz6SSPIGyK+IsBoNAQZib/KWbqX+Iny+NzOKlynl7XlOB9hFJxBmfF/7k1/1syM2QzOYwRJQskARHISEf273760iA5i5IXhM6wkDflP8UCWUD0DHOl3gkzzOP4BMnnZiwInuEUoR9bHieLHTXDfKlv5AxLlkbIc6VIvFkzzJHM5pWlR8vtAj5bHj9XEBU7w9nCmAUzLE2PDJr18ZbbJbIIef18kb/XbF4/+dozpX9ar5Atn5sliAqQr50zWz9fxJqNKY2T18bj+/jO+kTL/cVZXvJc4owwuT8/w19ul2ZHyudmIYdzdm6YfA/TOIFhMwx8gC8IRj4MEAZsgROiNiAcgCx+TtbkYryXildIhKmCLAYLuXF8BlvEtZrLsLW2tQFg8v5OH4m396fuJUTHz9pEJQA4DiLGnFlbkgIAZ9qR46MzazO1B0AxBIAru7gySfa0DT35hUHeDIqABjSADjAApsgbwhY4AlfgiVQcCEJBFIgHiwEXCEAmkIDlYBVYDwpAEdgGdoJysB8cBNXgODgJGsFZcBFcBTfBbdAFHoFeMABeglHwHoxDEISDKBAV0oB0ISPIArKFmJA75AsFQxFQPJQEpUIiSAatgjZARVAxVA4dgGqgn6Az0EXoOtQJPYD6oGHoDfQZRsFkmAZrw8bwPJgJs+AgOApeBKfCy+BcOB/eApfBlfAxuAG+CN+Eu+Be+CU8hgIoEoqO0kNZopgob1QoKgGVgpKg1qAKUaWoSlQdqhnVhrqL6kWNoD6hsWgqmoG2RLuiA9DRaC56GXoNejO6HF2NbkBfRt9F96FH0d8wFIwWxgLjgmFj4jCpmOWYAkwppgpzGnMF04UZwLzHYrF0rAnWCRuAjcemYVdiN2P3YuuxLdhObD92DIfDaeAscG64UBwHl4UrwO3GHcNdwN3BDeA+4kl4Xbwt3g+fgBfh8/Cl+KP48/g7+EH8OEGJYERwIYQSeIQVhK2EQ4Rmwi3CAGGcqEw0IboRo4hpxPXEMmId8QrxMfEtiUTSJzmTwklC0jpSGekE6Rqpj/SJrEI2J3uTE8ky8hbyEXIL+QH5LYVCMaZ4UhIoWZQtlBrKJcpTykcFqoKVAluBp7BWoUKhQeGOwitFgqKRIktxsWKuYqniKcVbiiNKBCVjJW8ljtIapQqlM0o9SmPKVGUb5VDlTOXNykeVrysPqeBUjFV8VXgq+SoHVS6p9FNRVAOqN5VL3UA9RL1CHaBhaSY0Ni2NVkQ7TuugjaqqqNqrxqjmqFaonlPtpaPoxnQ2PYO+lX6S3k3/rKatxlLjq21Sq1O7o/ZBfY66pzpfvVC9Xr1L/bMGQ8NXI11ju0ajxhNNtKa5Zrjmcs19mlc0R+bQ5rjO4c4pnHNyzkMtWMtcK0JrpdZBrXatMW0dbX9tsfZu7UvaIzp0HU+dNJ0SnfM6w7pUXXddoW6J7gXdFwxVBouRwShjXGaM6mnpBejJ9A7odeiN65voR+vn6dfrPzEgGjANUgxKDFoNRg11DUMMVxnWGj40IhgxjQRGu4zajD4YmxjHGm80bjQeMlE3YZvkmtSaPDalmHqYLjOtNL1nhjVjmqWb7TW7bQ6bO5gLzCvMb1nAFo4WQou9Fp1zMXOd54rmVs7tsSRbsiyzLWst+6zoVsFWeVaNVq/mGc5LmLd9Xtu8b9YO1hnWh6wf2ajYBNrk2TTbvLE1t+XaVtjes6PY+dmttWuye21vYc+332d/34HqEOKw0aHV4aujk6PEsc5x2MnQKclpj1MPk8YMY25mXnPGOHs5r3U+6/zJxdEly+Wkyx+ulq7prkddh+abzOfPPzS/303fjeN2wK3XneGe5P6je6+HngfHo9LjmaeBJ8+zynOQZcZKYx1jvfKy9pJ4nfb64O3ivdq7xQfl4+9T6NPhq+Ib7Vvu+9RP3y/Vr9Zv1N/Bf6V/SwAmIChge0APW5vNZdewRwOdAlcHXg4iB0UGlQc9CzYPlgQ3h8AhgSE7Qh4vMFogWtAYCkLZoTtCn4SZhC0L+yUcGx4WXhH+PMImYlVEWyQ1cknk0cj3UV5RW6MeRZtGy6JbYxRjEmNqYj7E+sQWx/bGzYtbHXczXjNeGN+UgEuISahKGFvou3DnwoFEh8SCxO5FJotyFl1frLk4Y/G5JYpLOEtOJWGSYpOOJn3hhHIqOWPJ7OQ9yaNcb+4u7kueJ6+EN8x34xfzB1PcUopThlLdUnekDgs8BKWCEaG3sFz4Oi0gbX/ah/TQ9CPpExmxGfWZ+MykzDMiFVG66PJSnaU5SzvFFuICce8yl2U7l41KgiRVUki6SNqURUMapXaZqew7WV+2e3ZF9sflMctP5SjniHLaV5iv2LRiMNcv9/BK9EruytZVeqvWr+pbzVp9YA20JnlN61qDtflrB9b5r6teT1yfvv7XPOu84rx3G2I3NOdr56/L7//O/7vaAoUCSUHPRteN+79Hfy/8vmOT3abdm74V8gpvFFkXlRZ92czdfOMHmx/KfpjYkrKlY6vj1n3bsNtE27q3e2yvLlYuzi3u3xGyo6GEUVJY8m7nkp3XS+1L9+8i7pLt6i0LLmvabbh72+4v5YLyrgqvivo9Wns27fmwl7f3zj7PfXX7tfcX7f/8o/DH+wf8DzRUGleWHsQezD74/FDMobbDzMM1VZpVRVVfj4iO9FZHVF+ucaqpOap1dGstXCurHT6WeOz2cZ/jTXWWdQfq6fVFJ8AJ2YkXPyX91H0y6GTrKeapup+Nft5zmnq6sAFqWNEw2iho7G2Kb+o8E3imtdm1+fQvVr8cOat3tuKc6rmt54nn889PXMi9MNYibhm5mHqxv3VJ66NLcZfuXQ6/3HEl6Mq1q35XL7Wx2i5cc7t29rrL9TM3mDcabzrebGh3aD/9q8OvpzscOxpuOd1quu18u7lzfuf5Ox53Lt71uXv1Hvveza4FXZ3d0d33exJ7eu/z7g89yHjw+mH2w/FH6x5jHhc+UXpS+lTraeVvZr/V9zr2nuvz6Wt/FvnsUT+3/+Xv0t+/DOQ/pzwvHdQdrBmyHTo77Dd8+8XCFwMvxS/HRwr+ofyPPa9MX/38h+cf7aNxowOvJa8n3mx+q/H2yDv7d61jYWNP32e+H/9Q+FHjY/Un5qe2z7GfB8eXf8F9Kftq9rX5W9C3xxOZExNijoQz1QqgEIVTUgB4cwTpj+MBoN4GgLhwur+eEmj6P8EUgf/E0z34lDgCUO0JQBSik+3jYURNEFVAfodN22E7O7n+S6QpdrbTsUiNSGtSOjHxFukfcWYAfO2ZmBhvnJj4WoUU+xCAlvfTff2kKB0D4LUByzoo+DHeJgf8TaZ7/j+t8e8jmKzAHvx9/CeYKxgxHLsT+AAAAS9QTFRF7Ozs19fX////1NTU3Nzc6Ojo8fHx1tbW/Pz8+/v78/PzztffzNfhytbfydTe0Nfe2NjY8PDw5+fn5ubmvb297+/v7u7u+vr69/f36urq8vLy/vf0/Ovk//38+uDW8Jx89Orn09PTysrK4uLi9PT06+vr/fTx+unj/fv6/f392dnZ6vH3lLbP///9+Pj4/v7+/f7+n7/W4erv//78+9+y98OI/vfufqi/obCU/+6zp8XakKmd6NiQ/Orj75pk9b2T/fPq9PTn/+ed//329fj7/uih//fe9Luj+uHP4ODg9fX14+Pj3t7e4eHh39/f6enp3d3d8Pf80ub2/f7/sNPvKIfT7/P20dHR7vX7zeLz/Pz96/L3l7jQ///+ocDX4urwfqfAn6+V/+60jaed59eRBSPF/wAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNaxSFUMAAAERSURBVCjPjdHXUsJQEAbgdRHCapBmALFArAQ1UcFewC4BLNh7ff9n8ByYhGQmJ5P/4r/6spOzCzCAocFwRIqif4CGhuXYiByTeeIJYQCTqZSUSPc+C48KA6RksnZyEWFgDPIYJEAZC45PTPpBTFpwqlBUp9UZEZyds+D8QkkTB8ppC2pRHmc7dwsheyLh4tIy6sbK6hoSVarrG+SEZQfc3NpmcGd3j8H9g1rdBRWlDw+Pjhk8OT1jEM8v0AUb9h7JbDRbDLYvr0yiZrt1TaJ/1FjrBm82MQ8ogiaP1u2szjvnvfCbzm2wy9zdP0jqYwD49Pzid5k+dF3GbyLh69s7e7Xx8el6rwf8+v7hl/n984D/pCs0bVB0kesAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE0OTQWOCcIAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NzZ5ku5bAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjF9ve4mAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-ext\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=374 374w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/O6zcitSTMPIqXyKK0lMKA/9cf41d9f4c769a6d5fb0e9d938aaa64a/jupyter-ext.png?w=1494 1494w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<br>\n<h2 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h2>\n<p>tensorboard가 아니더라도 jupyter-server-proxy를 사용하면 Spark UI, R Studio Session 등 다양한 외부 웹 서비스들과 연동할 수 있습니다.</p>\n<ul>\n<li><a href=\"https://github.com/jupyterhub/jupyter-server-proxy\">https://github.com/jupyterhub/jupyter-server-proxy</a></li>\n<li><a href=\"https://github.com/kopwei/jupyter-tensorboard-proxy\">https://github.com/kopwei/jupyter-tensorboard-proxy</a></li>\n</ul>","excerpt":"이 글에서는 JupyterHub 사용자 환경에 tensorboard를 proxy…"}}},{"id":"29b26dc7-c49b-5fb3-99cd-814af4eae2cd","title":"Spark on Kubernetes: 성능 최적화 방법들","slug":"spark-on-kubernetes-perf","publishDate":"September 11, 2021","publishDateISO":"2021-09-11","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN 만큼의 성능을 내기 위해서 필요한 설정들에 대해 알아보겠습니다.</p>\n<br>\n<h2 id=\"교차-az-전송-지연-개선\" style=\"position:relative;\"><a href=\"#%EA%B5%90%EC%B0%A8-az-%EC%A0%84%EC%86%A1-%EC%A7%80%EC%97%B0-%EA%B0%9C%EC%84%A0\" aria-label=\"교차 az 전송 지연 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>교차 AZ 전송 지연 개선</h2>\n<p>대부분 사용자들은 가용성을 우려하여 Multi-AZ 사용을 선호합니다.\n하지만 driver, executor pod가 여러 AZ에 분산되어 있는 어플리케이션은 AZ 간 <strong>추가 데이터 전송 비용</strong>이 발생할 수 있습니다. 특히 spark shuffle은 disk IO, network IO에 대한 비용이 많이 드는 연산이므로 latency가 낮은 단일 AZ가 좋은 성능을 보일 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.node.selector.zone='&lt;availability zone>'</code></pre></div>\n<p>Spark on Kubernetes에서는 Pod Template 또는 node selector 설정을 통해 단일 AZ 노드 그룹에서 실행되도록 설정할 수 있습니다.</p>\n<br>\n<h2 id=\"클러스터-노드-가용성-계산하기\" style=\"position:relative;\"><a href=\"#%ED%81%B4%EB%9F%AC%EC%8A%A4%ED%84%B0-%EB%85%B8%EB%93%9C-%EA%B0%80%EC%9A%A9%EC%84%B1-%EA%B3%84%EC%82%B0%ED%95%98%EA%B8%B0\" aria-label=\"클러스터 노드 가용성 계산하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>클러스터 노드 가용성 계산하기</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 63.72430471584038%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAZCAMAAAB0BpxXAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACx1BMVEX////d3d3W1tbc3Nz+/v7X09Pd09PX0tL9/f3m6tqot33r7uHi4uLq6urh4eHs7Ozt7e3j4+P6+vrJycnR0sCvs5Dr7cS1uZbb3bbHyqXJzKfY27S4vJjp68Ouso/k5r69wZ3T1q+9v6/p6enEz6eEmUfN1bTNzc29vb3Dw8O/v7/KysrFxcW1tbX4+Pjg5c230mnJ34Sty1nT5pSjw0nW6ZmiwkjU55Wox1LN4ouzz2Lh5svr6+v5+fnp7d/Z653g8KjU55bl86/Q5I/m9LHP5I7l87DS5pPi8avX6Zrx8fH29vaxzl/E232lxU2avTuZvDrQ5JCgwUXJ34Wsylfy8vL8/Pzl5eX09PTg8KnV6Jbo9rXk86/t+bzt+r3l9LHs+Lrn9bPY38WYqmXe5M6ysrKjo6OdnZ2qqqqnp6fExMSyzmDF3H6mxk6bvT3c7aHy/cT19fXu7u7S2buPolfZ38a4uLitra2fn5+rq6u0tLTU1NSTn2egq3SYpG3d6bDx/MPu+cDt+L/GurWylInDtbD7/PnY38T8/fu7u7vAwMDLy8vIyMi3t7fQ0NC5pKmSX2upgYqjeIKmfYerg42le4Wqg4ypgIqnfYe0nKLAy6GcrWvI0q2lpaWsrKympqapqane3t6idoCqgoyfcnyfcn2id4Gjd4Kgc32jeYOgdH7u8eWyv4zy9OucnJyioqKgoKDCwsLk5OTm5ua3vcSOna6yucH09u/v7++12uSJ5fx4yd1zwdRttshstcd7zeKv2uXJ0q7R2bqvr6+urq6A1+xwus1uuMpvus1/1Orh5tKisnW6urq5ubmhoaG8vLyiyNNcuNNyw9tqv9hwwtprv9huwdltwdltwNlduNOaxtOpxs5rsMaLwNGJv9CMwdGQwtKIvtBtsceiw82Qo1mkpKS+vr7GxsaXqWTf5c+ampra2trBwcH1xt/RAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAbRJREFUOMtjYKA2YAQTjChCjH+wKGQBExgKORlB4P9/ZkbGvyzvYAqFGVHBR+nXYjD2PwZmxndwq/VhwmAjGM+aMB63OoTNagZ+ZIWfGPgY/xzC6kYGXkbGrzxPZBn/P5YHKQSDUMZVIJKJcQWSws9SjD+YNIAmagONfc7AzZwEMj+N8Zg14xFbZBN1GBlfyiICSQbmZt/1gdaCyApZGRh0wQweRpDym4xbYXquo7oR4WRQgGAFaAo/gMmj8jgUhqDEjNdZxlttIBcuTCjvaq9iLEIo5AE5DOr+3385GawYRYDxI1B8evaJnlvqmhXxCKsFocr+MDE/g/LvKd52Y/SJXha9bD/cRFVkq4EcdcbQ7Z42h6582sbwI4jBF2E1KyMD1OrfQAYbwxPmg5sP3RYS2bbv04HXxycx/EDxNRc44YCZXxk5w+0OzxHy2pLKqPDh2MO7JdDUcwHhF8YfDJx6TogARw0ebqjC/0x/WZgZ2Bk0nhxSqms+JcLIMSf6zfEuRFZ4drLWC6G3UPEHQ2kx4+M5Qn+ZQh4zWjKKwhVu3KGcgFA4v/IPrszFghKRf/5QlF0B6zp4AUQ0JbYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE2NTS5CbxqAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMDU0BH8bMAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"k8s-resource\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=414 414w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=827 827w,\nhttps://images.ctfassets.net/tushy4jlcik7/2TC5DgSCNitZVsFqBXNWgc/2df2478fb59e2b54a2ae5a2ad3fbf21c/k8s-resource.png?w=1654 1654w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>노드 전체의 리소스를 최대로 사용하기 위해 어느 정도의 리소스를 할당할 수 있는지 계산할 수 있어야 합니다. 모든 Kubernetes 노드는 클러스터 운영을 위해 <strong>OS 시스템과 Kubelet에서 일정량의 리소스를 점유</strong>하고 있습니다. 따라서 Pod에 할당 가능한 리소스를 계산할 때 이 부분은 제외하고 계산해야 합니다. 만약 노드마다 뜨는 daemonset이나 agent와 같은 어플리케이션을 띄웠다면 해당 리소스도 제외되어야 합니다.</p>\n<p>클라우드 인스턴스 유형에 따라 빠르게 보고 싶을 때 <a href=\"https://learnk8s.io/kubernetes-instance-calculator\">Kubernetes Instance Calculator</a>를 사용하면 쉽게 계산할 수 있습니다.</p>\n<br>\n<h2 id=\"셔플-단계에서의-scratch-space-개선\" style=\"position:relative;\"><a href=\"#%EC%85%94%ED%94%8C-%EB%8B%A8%EA%B3%84%EC%97%90%EC%84%9C%EC%9D%98-scratch-space-%EA%B0%9C%EC%84%A0\" aria-label=\"셔플 단계에서의 scratch space 개선 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>셔플 단계에서의 scratch space 개선</h2>\n<p>Spark Shuffle 발생 시 중간 파일들이 생기게 되는데, 보통 driver나 executor의 로컬 디렉토리를 사용합니다. 하지만 Kubernetes의 경우, 기본 값으로 Pod 내부의 볼륨(emptyDir)을 사용하고 있습니다.</p>\n<p>emptyDir 유형의 볼륨은 Docker Storage Driver의 CoW(Copy-On-Write) 오버헤드로 인해 작은 파일 쓰기를 반복하는 경우 속도가 느려질 수 있습니다. 이를 개선하기 위해 Spark on Kubernetes GA 버전에서는 2가지의 설정이 추가되었습니다.</p>\n<br>\n<h3 id=\"1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" style=\"position:relative;\"><a href=\"#1-spark-25262-support-tmpfs-for-local-dirs-in-k8s\" aria-label=\"1 spark 25262 support tmpfs for local dirs in k8s permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. [SPARK-25262] Support tmpfs for local dirs in k8s</h3>\n<p>먼저 tmpfs를 local dir로 활용하는 방법입니다.\ntmpfs는 RAM 기반 파일 시스템으로 노드 재부팅 시 지워지고, 파일이 컨테이너 메모리 제한에 포함됩니다. 설정 방법은 아래와 같이 간단하지만 tmpfs 사이즈가 커질 수록 Pod OOM이 발생할 가능성이 크다보니 운영할 때는 번거로울 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.local.dirs.tmpfs\": \"true\"</code></pre></div>\n<br>\n<h3 id=\"2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" style=\"position:relative;\"><a href=\"#2-spark-27499-support-mapping-sparklocaldir-to-hostpath-volume\" aria-label=\"2 spark 27499 support mapping sparklocaldir to hostpath volume permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. [SPARK-27499] Support mapping spark.local.dir to hostPath volume</h3>\n<p>다음은 host에 마운트된 볼륨을 직접 사용하는 방법입니다. hostPath 볼륨을 spark.local.dir에 할당해서 셔플 과정에서의 디스크 성능을 향상시킬 수 있습니다. 다만 인스턴스에 SSD 또는 NVMe와 같은 볼륨을 추가로 마운트하는 경우에 더 좋은 효과를 볼 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">spec</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">...</span>\n  <span class=\"token key atrule\">volumes</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span>\n      <span class=\"token key atrule\">hostPath</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">path</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"/tmp/spark-local-dir\"</span>\n  <span class=\"token key atrule\">executor</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">instances</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n    <span class=\"token key atrule\">cores</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n    <span class=\"token punctuation\">...</span>.\n    <span class=\"token key atrule\">volumeMounts</span><span class=\"token punctuation\">:</span>\n      <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"spark-local-dir-1\"</span></code></pre></div>\n<br>\n<h2 id=\"executor-pod-batch-관련-설정\" style=\"position:relative;\"><a href=\"#executor-pod-batch-%EA%B4%80%EB%A0%A8-%EC%84%A4%EC%A0%95\" aria-label=\"executor pod batch 관련 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Executor Pod Batch 관련 설정</h2>\n<p>보통 무거운 작업은 executor 여러 개가 떠서 처리하는 경우가 많습니다.\nSpark on Kubernetes에는 executor pod을 생성할 때 <strong>batch size와 delay</strong>가 존재합니다.</p>\n<p>예를 들어 executor 10개를 띄울 때 기본 설정 값이 <code class=\"language-text\">batch size = 5, delay = 1</code>로 되어 있다면, executor pod 5개가 동시에 뜨고 1초 지연 이후에 5개가 추가로 생성됩니다.\n이 설정 값은 Kubernetes Scheduler와 driver pod의 부하를 고려해서 설정해주어야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">\"spark.kubernetes.allocation.batch.size\": \"5\"\n\"spark.kubernetes.allocation.batch.delay\": \"1s\"</code></pre></div>\n<br>\n<p>반면 아직 3.1 버전 기준으로 지원하지 않는 설정들은 아래와 같습니다.</p>\n<ul>\n<li>External Shuffle Service는 지원하지 않음</li>\n<li>Job Queue 없음 (Future Work)</li>\n</ul>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes\">https://aws.amazon.com/ko/blogs/containers/optimizing-spark-performance-on-kubernetes</a></li>\n<li><a href=\"https://aws.github.io/aws-emr-containers-best-practices\">https://aws.github.io/aws-emr-containers-best-practices</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/running-on-kubernetes.html\">https://spark.apache.org/docs/latest/running-on-kubernetes.html</a></li>\n</ul>","excerpt":"Spark 3.1 버전부터 Spark on Kubernetes가 GA로 변경되었습니다.\n이 글에서는 Spark on YARN…"}}},{"id":"87397863-28d6-5e79-898e-aeccb9f21920","title":"JupyterHub on Kubernetes","slug":"jupyterhub-on-kubernetes","publishDate":"October 23, 2021","publishDateISO":"2021-10-23","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":4,"html":"<p>일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.<br>\n이 글에서는 <a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a>에 포함된 다양한 기능들에 대해 소개해보려 합니다.</p>\n<p><strong>목차</strong></p>\n<ul>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#kubespawner\">kubespawner</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#zero-to-jupyterhub-k8s-chart\">zero-to-jupyterhub-k8s chart</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#proxy\">proxy</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#singleuser-profile\">singleuser, profile</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#idle-culler\">idle-culler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#user-scheduler\">user-scheduler</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#image-pre-puller\">image-pre-puller</a></li>\n<li><a href=\"https://swalloow.github.io/jupyterhub-on-kubernetes/#monitoring\">monitoring</a></li>\n</ul>\n<p><br><br></p>\n<h2 id=\"kubespawner\" style=\"position:relative;\"><a href=\"#kubespawner\" aria-label=\"kubespawner permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>KubeSpawner</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.94274028629857%; position: relative; bottom: 0; left: 0; background-image: url('data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBQUFBT/wAARCAAVACgDASIAAhEBAxEB/8QAGAABAQEBAQAAAAAAAAAAAAAAAAQFAwn/xAArEAACAQMEAQIEBwAAAAAAAAABAgMABBEFEiExBhMiFBVBYTJRUnFygYL/xAAXAQEBAQEAAAAAAAAAAAAAAAABAAID/8QAGhEBAAIDAQAAAAAAAAAAAAAAAAERAjFhQf/aAAwDAQACEQMRAD8A9RZbuCBtss0cZ7w7gVzcJfpmGdSoOMxucZ/ywqTXNG03UbWV9RiMsCKXb3uMAA84U/kT1WcLzRbKygjtLq0i9TDobxjIVDICCVZgwyAvGRXVzuLpPLprwaoxTXbyR9+74UTAq+SfZhm4A2/Qg891a+pT6NAZ5red2kGBA78jaCeDvcZPA7H0/rm/jmj3TwatN8NNdRyrMl4S2wOFMYIG7jgle/tXO4tPHPIo7c3zWVw1tI8qenJsUe113EBuRsLd5HJNUdanjR0PyD50Bm3a2YqWMbtllwcc8Y57GCaVL43DpVjLPFp8ENtbCX07d4rgOs52KzbRnsbcH+NKdBvXEEd1BJDKoeKRSjqeiCMEVmt4loroivpVnIEQRqXhViFAwBkjPQFKUV6bmqXpY2yW626wRrAv4Ywo2j9hUdr41pNiSbbTbW2JBGYYVQ4xj6D70pUE2lWsR1bUUa3gItZ0Nu3p++PdCufcSf1N1jgkUpStZbUP/9k='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jhub-fluxogram\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=245 245w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/1g2pkofkAsduRPGEVFH4B5/814e722e99a99dca7afe2b9dc0310f31/jhub-fluxogram.jpeg?w=978 978w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>먼저 JupyterHub의 기본 아키텍쳐에 대해 간단히 짚고 넘어가보겠습니다.\nJupyterHub에는 노트북 서버를 다양한 방법을 통해 프로비저닝하기 위해 <strong>Spawner</strong>라는 인터페이스가 존재합니다. K8S 환경이라면 KubeSpawner를 사용하게 됩니다. 이를 통해 프로비저닝 단계에서 kube-scheduler 기반으로 다양한 K8S 리소스를 노트북 서버와 함께 사용할 수 있습니다. 또한 KubeSpawner는 <strong>사용자에게 격리된 환경과 컴퓨팅 리소스를 제공</strong>할 수 있습니다.</p>\n<p><strong>노트북 Pod 생성 이벤트</strong><br>\n노트북이 생성되는 과정은 다음과 같습니다.</p>\n<ul>\n<li>할당 가능한 노드 탐색 (NodeSelector, Affinity)</li>\n<li>없으면 CA에 의해 노드 추가, 노드가 Ready 상태가 될 때까지 대기</li>\n<li>Pod을 추가된 노드에 할당</li>\n<li>노트북 이미지 pull</li>\n<li>노트북 컨테이너 실행</li>\n</ul>\n<br>\n<h2 id=\"zero-to-jupyterhub-k8s-chart\" style=\"position:relative;\"><a href=\"#zero-to-jupyterhub-k8s-chart\" aria-label=\"zero to jupyterhub k8s chart permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>zero-to-jupyterhub-k8s Chart</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 58.467741935483865%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMY2lDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E6RXKSG0AAJSBVEJSSChxJgQVOxlUcG1iwhWdFVE0bUAsqiIvSyKvS8WVJR1saAoKm9CArruK9873zd3/nvmzH/Knbn3DgCavVyJJA/VAiBfXCCNDw9mjk1NY5I6ABEYAzJgAmMuTyZhxcVFAyiD/d/l/Q2AKPqrjgquf47/V9HhC2Q8AJB0iDP5Ml4+xM0A4Ot5EmkBAESF3mJKgUSB50CsK4UBQrxagbOVeKcCZypx04BNYjwb4ssAqFG5XGk2ABr3oJ5ZyMuGPBqfIXYW80ViADRHQBzAE3L5ECtiH5GfP0mByyG2hfYSiGE8wDvzO87sv/FnDvFzudlDWJnXgKiFiGSSPO60/7M0/1vy8+SDPqxhowqlEfGK/GENb+VOilJgKsRd4syYWEWtIe4V8ZV1BwClCOURSUp71IgnY8P6AQbEznxuSBTERhCHifNiolX6zCxRGAdiuFrQqaICTiLE+hAvEshCE1Q2m6WT4lW+0LosKZul0p/lSgf8Knw9kOcmsVT8b4QCjoof0ygSJqZATIHYslCUHAOxBsROstyEKJXNqCIhO2bQRiqPV8RvCXG8QBwerOTHCrOkYfEq+5J82WC+2GahiBOjwvsLhIkRyvpgJ3ncgfhhLthlgZiVNMgjkI2NHsyFLwgJVeaOPReIkxJUPL2SguB45VycIsmLU9nj5oK8cIXeHGJ3WWGCai6eXAAXp5Ifz5IUxCUq48SLcriRccp48OUgGrBBCNx9ctgywSSQA0StXfVd8E45Ega4QAqygQA4qjSDM1IGRsTwmgCKwJ8QCYBsaF7wwKgAFEL9lyGt8uoIsgZGCwdm5IKnEOeDKJAH7+UDs8RD3pLBE6gR/cM7FzYejDcPNsX4v9cPar9pWFATrdLIBz0yNQctiaHEEGIEMYxohxviAbgfHg2vQbC54t64z2Ae3+wJTwlthEeE64R2wu2JonnSH6IcDdohf5iqFpnf1wK3hpweeDDuD9khM87ADYEj7g79sPBA6NkDatmquBVVYf7A/bcMvnsaKjuyMxklDyMHkW1/nKlhr+ExxKKo9ff1UcaaOVRv9tDIj/7Z31WfD/uoHy2xRdgB7Ax2HDuHNWH1gIkdwxqwi9gRBR5aXU8GVtegt/iBeHIhj+gf/rgqn4pKypxrnDudPyvHCgRTCxQbjz1JMk0qyhYWMFnw6yBgcsQ8pxFMV2dXFwAU3xrl6+stY+AbgjDOf9PNh3vcX9zf39/0TRf1CYCDZnD7t3/T2VyBrwn4nj67gieXFip1uOJCgG8JTbjTDIAJsAC2MB9X4An8QBAIBZEgFiSCVDABVlkI17kUTAEzwFxQDErBcrAGVIBNYCvYCfaA/aAeNIHj4DS4AC6D6+AuXD0d4CXoBu9BH4IgJISG0BEDxBSxQhwQV8QbCUBCkWgkHklFMpBsRIzIkRnIfKQUWYlUIFuQauRX5DByHDmHtCG3kYdIJ/IG+YRiKBXVRY1Ra3Qk6o2y0Cg0ER2PZqOT0SJ0AboULUer0N1oHXocvYBeR9vRl2gPBjB1jIGZYY6YN8bGYrE0LAuTYrOwEqwMq8JqsUb4nK9i7VgX9hEn4nSciTvCFRyBJ+E8fDI+C1+CV+A78Tr8JH4Vf4h3418JNIIRwYHgS+AQxhKyCVMIxYQywnbCIcIpuJc6CO+JRCKDaEP0gnsxlZhDnE5cQtxA3EtsJrYRHxN7SCSSAcmB5E+KJXFJBaRi0jrSbtIx0hVSB6lXTV3NVM1VLUwtTU2sNk+tTG2X2lG1K2rP1PrIWmQrsi85lswnTyMvI28jN5IvkTvIfRRtig3Fn5JIyaHMpZRTaimnKPcob9XV1c3VfdTHqIvU56iXq+9TP6v+UP0jVYdqT2VT06ly6lLqDmoz9Tb1LY1Gs6YF0dJoBbSltGraCdoDWq8GXcNJg6PB15itUalRp3FF45UmWdNKk6U5QbNIs0zzgOYlzS4tspa1FluLqzVLq1LrsNZNrR5turaLdqx2vvYS7V3a57Sf65B0rHVCdfg6C3S26pzQeUzH6BZ0Np1Hn0/fRj9F79Al6trocnRzdEt19+i26nbr6ei56yXrTdWr1Dui187AGNYMDiOPsYyxn3GD8WmY8TDWMMGwxcNqh10Z9kF/uH6QvkC/RH+v/nX9TwZMg1CDXIMVBvUG9w1xQ3vDMYZTDDcanjLsGq473G84b3jJ8P3D7xihRvZG8UbTjbYaXTTqMTYxDjeWGK8zPmHcZcIwCTLJMVltctSk05RuGmAqMl1tesz0BVOPyWLmMcuZJ5ndZkZmEWZysy1mrWZ95jbmSebzzPea37egWHhbZFmstmix6LY0tRxtOcOyxvKOFdnK20potdbqjNUHaxvrFOuF1vXWz230bTg2RTY1NvdsabaBtpNtq2yv2RHtvO1y7TbYXbZH7T3shfaV9pccUAdPB5HDBoe2EYQRPiPEI6pG3HSkOrIcCx1rHB86MZyineY51Tu9Gmk5Mm3kipFnRn519nDOc97mfNdFxyXSZZ5Lo8sbV3tXnmul6zU3mluY22y3BrfX7g7uAveN7rc86B6jPRZ6tHh88fTylHrWenZ6WXpleK33uumt6x3nvcT7rA/BJ9hntk+Tz0dfT98C3/2+f/k5+uX67fJ7PspmlGDUtlGP/c39uf5b/NsDmAEZAZsD2gPNArmBVYGPgiyC+EHbg56x7Fg5rN2sV8HOwdLgQ8Ef2L7smezmECwkPKQkpDVUJzQptCL0QZh5WHZYTVh3uEf49PDmCEJEVMSKiJscYw6PU83pjvSKnBl5MooalRBVEfUo2j5aGt04Gh0dOXrV6HsxVjHimPpYEMuJXRV7P84mbnLcb2OIY+LGVI55Gu8SPyP+TAI9YWLCroT3icGJyxLvJtkmyZNakjWT05Orkz+khKSsTGkfO3LszLEXUg1TRakNaaS05LTtaT3jQsetGdeR7pFenH5jvM34qePPTTCckDfhyETNidyJBzIIGSkZuzI+c2O5VdyeTE7m+sxuHpu3lveSH8Rfze8U+AtWCp5l+WetzHqe7Z+9KrtTGCgsE3aJ2KIK0euciJxNOR9yY3N35PbnpeTtzVfLz8g/LNYR54pPTjKZNHVSm8RBUixpn+w7ec3kbmmUdLsMkY2XNRTowp/6i3Jb+U/yh4UBhZWFvVOSpxyYqj1VPPXiNPtpi6c9Kwor+mU6Pp03vWWG2Yy5Mx7OZM3cMguZlTmrZbbF7AWzO+aEz9k5lzI3d+7v85znrZz3bn7K/MYFxgvmLHj8U/hPNcUaxdLimwv9Fm5ahC8SLWpd7LZ43eKvJfyS86XOpWWln5fwlpz/2eXn8p/7l2YtbV3muWzjcuJy8fIbKwJX7FypvbJo5eNVo1fVrWauLln9bs3ENefK3Ms2raWsla9tL48ub1hnuW75us8VworrlcGVe9cbrV+8/sMG/oYrG4M21m4y3lS66dNm0eZbW8K31FVZV5VtJW4t3Pp0W/K2M794/1K93XB76fYvO8Q72nfG7zxZ7VVdvcto17IatEZe07k7ffflPSF7Gmoda7fsZewt3Qf2yfe9+DXj1xv7o/a3HPA+UHvQ6uD6Q/RDJXVI3bS67nphfXtDakPb4cjDLY1+jYd+c/ptR5NZU+URvSPLjlKOLjjaf6zoWE+zpLnrePbxxy0TW+6eGHvi2skxJ1tPRZ06ezrs9IkzrDPHzvqfbTrne+7wee/z9Rc8L9Rd9Lh46HeP3w+1erbWXfK61HDZ53Jj26i2o1cCrxy/GnL19DXOtQvXY6633Ui6cetm+s32W/xbz2/n3X59p/BO39059wj3Su5r3S97YPSg6g+7P/a2e7YfeRjy8OKjhEd3H/Mev3wie/K5Y8FT2tOyZ6bPqp+7Pm/qDOu8/GLci46Xkpd9XcV/av+5/pXtq4N/Bf11sXtsd8dr6ev+N0veGrzd8c79XUtPXM+D9/nv+z6U9Br07vzo/fHMp5RPz/qmfCZ9Lv9i96Xxa9TXe/35/f0SrpQ78CuAwYZmZQHwZgcAtFQA6PDcRhmnPAsOCKI8vw4g8J+w8rw4IJ4A1MJO8RvPbgZgH2zWcyA3bIpf+MQggLq5DTWVyLLcXJVcVHgSIvT29781BoDUCMAXaX9/34b+/i/bYLC3AWierDyDKoQIzwyb/RXoun56L/hBlOfT73L8sQeKCNzBj/2/AE1ckBrBY2epAAACiFBMVEX////8/Pzi5OX3+PjozrvhpHn25dr09fXR09bp6uvj4+PV1dXW1tbZ2dnp6enJk27chUfv0r3o6erg4ePm5+nv3dDcrIr57uft7e3+/v7k5OTs7O3a29zc3d7Z2tvl5ujz9Pbp6+z4+Pnr7O3b3N3d3d/p6uz09fbu7/Hl5+rn6ezp6+7q7O/h5u6tv93p6+/n2dfks6bmvK3y9PXt7vDm6Ovr7fDy8/Xf5e6+z+zj5+6yxuqMrurQ2u3gqZzfm4Lr0Krx8/XA0Oy3zPLE0+zb3+Whr8np4uLi19fa3N+3wdHd3uHm6e+4xt7f4eTNz9LY2t3Y4O6tw+l8o+fN2ezm5+rn6evZ2tzn6u/R2+3P2u3p7O++z+vJ2fXC0evb4OiYq8zs7e7h4eHe3t7o6Ojh4+bb3eDNzs/Mzc+qvt+7z/LQ2Obe4OO3xuFai+GyxOTX2dzZ293W2NvL0NiQqNHR1NrN1+fn6Ory8vL09PXr7Ozi5OfFzdmXq87i5eqOpc3a3uXg4uXh4uXo6u21yet/pefG0uXc3uHX2dva297o6evj5ejN2e2VtOnS3O3K0NqKocnb3eHU1djW2Nrx8vPT3e12nuTO2e2EqObU3e3k5unK0+JxmuLF0OTNz9Ha3N7O0NLi4+bQ0tXq6+7Fxsn29/jx8vTk5ef39/nt7/Ll5unu8PKPobZdiL7X4u/29vbu7u78/f7d5fPb5PP+///s393oysVxhqFTgLrG1ej19fXn5+fd3d3g4ODB0/S6z/Lq8PvP3fbN3PbF1fDx7+/AgXfLeGz88/KxvMr19fbv7+/R1+Kfs9Xf39/6+vrd3+GZr9Tb3eL9/f38+vrHlo/WkYf78O77+/t594saAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC02NVtE+QAAAaJJREFUGBmNwU9ozmEAwPHv97fH+9ved++7pFmiyJYQo13WlvInpSSTEjnJzclNbsp9Ds4SB0mRRhJSXLxamtUOkkwyh9nb1Ord9Nb2ep/X3pXa1j4f1krUeWqCVlhZIOOSCisL5LRETbuyioTpdSWiECZZhWw2AqyyKFHnshWWpJ8J5LWaCOo8QSuQWmbTbIYlWQi0laFVZwr6m4KWgPwf5uQ/gSirM1knElqcYHkJUZqmpGkCPzOdXSwrIfqRfieT2cmu3S3pR+r27AW699EQiPbbM5L3A616/7w1XZPrPWjNUb9tf94EBKIOZfQYbNTLPiEtTA3oAk3qVE9VaqS3DJx9wDl9D33jnb86pjd82XG3/93AEIuywwSiC168ndNx6Cjmt5l7NFWkCpecvcOiQJRTbvUXiV5CWiDaqmnngINECdGL5jE8QHRlgYabzc2DX28MUif35J+JLYBVILl2HayCVeqSM0jDQz19tRc8RTTkSXjqCeCZxyHQkFOOqK+oy/vm0Ft9DO1a7CPQMHpYyjQMqyNqWzdjKmvyOvuJtfsLxDNfjAjhOIYAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5ODQH+4UaAAAAGXRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgAxMTYwKf3m3QAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIxfb3uJgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"jupyter-arch\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=496 496w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=992 992w,\nhttps://images.ctfassets.net/tushy4jlcik7/4MoN7kIqTpEHdcjmdL5Y6u/fff4757c2dec3620e147654578a3be6f/jupyter-arch.png?w=1984 1984w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><a href=\"https://github.com/jupyterhub/zero-to-jupyterhub-k8s\">zero-to-jupyterhub-k8s Helm Chart</a> 의 아키텍쳐는 위의 그림과 같습니다. 기존 JupyterHub와 달리 hook-image-awaiter, jupyterhub-idle-culler 등의 컴포넌트가 추가된 모습을 확인하실 수 있습니다. 이제 대략적으로 어떤 기능을 제공하는지 알아보겠습니다.</p>\n<br>\n<h2 id=\"proxy\" style=\"position:relative;\"><a href=\"#proxy\" aria-label=\"proxy permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Proxy</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">proxy</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">service</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> ClusterIP\n  <span class=\"token key atrule\">chp</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">networkPolicy</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">false</span></code></pre></div>\n<p>먼저 CHP(configurable-http-proxy) 설정 부분입니다. JupyterHub에서 <strong>Proxy는 인증, 사용자 노트북 라우팅, 헬스 체크 등 다양한 역할을 수행</strong>합니다. 차트에서는 유연한 Proxy 설정을 위해 CHP, Traefik 등 다양한 옵션을 지원합니다. 아키텍쳐는 aws-load-balancer-controller를 사용한다는 가정하에 구성한 예시입니다. 위 그림과 같이 사용자는 중간의 Proxy 컴포넌트를 거쳐 JupyterHub에 접속하게 됩니다.</p>\n<br>\n<h2 id=\"singleuser-profile\" style=\"position:relative;\"><a href=\"#singleuser-profile\" aria-label=\"singleuser profile permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SingleUser, Profile</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 34.9112426035503%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAOCAMAAABq1a50AAAKw2lDQ1BpY2MAAEiJlZcHVFPZFob3vekhoQUiICX0JkiRLiX0AArSQVRCEkgoISaAgl0ZHMFRQUQEywiOiig4FkDGigUrigXsE2RQUcdBHWyovAs8wsx767233r/WWffLzj57n3PW2XftC0AncyWSTFQVIEucI40M8mXFJySySL8BAihQgQy6XJ5Mwo6ICANM48+/630X5o3pls1IrH///79KjS+Q8QCQCIxT+DJeFsZHsPGaJ5HmAOB2YXbjBTmSEb6IsYYUWyDGD0c4bYwHRjhllPH4UZ/oSD+MtQDINC5XmgZAM8HsrDxeGhaH5o+xnZgvEmOM/QYvnpDLxxjLC1OysrJHWI6xRcpf4qT9LWaKIiaXm6bgsb2Miuwvkkkyufn/53H8b2Vl5o7nMMMGTSgNjsSeTOzM7mZkhypYnDIzfJxF/FH/URbmBseMM0/mlzjOfK5/qGJu5sywcU4VBXIUcXI40eMskAVEjbM0O1KRK1Xqxx5nrnQib25GjMIuFHAU8QuE0XHjnCeKnTnOsoyo0AkfP4VdmhupWL9AHOQ7kTdQsfcs2V/2K+Io5uYIo4MVe+dOrF8gZk/ElMUr1sYX+AdM+MQo/CU5vopckswIhb8gM0hhl+VFKebmYBdyYm6E4gzTuSER4wxhEAQsiIFMyAEpcDEOBuym5ggWjtxR8MuW5EtFacIcFhurMgGLI+bZTmE52DnYAYzU7NiVeBc5WosI8+SELRurIdf3WJ2UTthSygGaiwC07k/YTLYDqBQCNLXxcqV5Y7aRcgIC9iZQAQ3QBn0wBguwAQdwBg/wgQAIgXCIhgSYCzwQQha28gWwGFZAEZTABtgEVbADamEvHIBD0AzH4QxcgCtwA+7AA5BDH7yEAXgPQwiCkBA6wkC0EQPEFLFGHBBXxAsJQMKQSCQBSUbSEDGSiyxGViElSBlShexE6pCfkWPIGeQS0oncQ3qQfuQt8hnFoTRUA9VDzdCpqCvKRkPRaHQOmobORwvQQnQdWonWoPvRJvQMegW9g8rRl+ggDnBKOCbOEGeDc8X54cJxibhUnBS3FFeMq8DV4Bpwrbh23C2cHPcK9wlPxDPwLLwN3gMfjI/B8/Dz8Uvxa/FV+L34Jvw5/C18D34A/41AJ+gSrAnuBA4hnpBGWEAoIlQQdhOOEs4T7hD6CO+JRCKTaE50IQYTE4jpxEXEtcRtxEbiaWInsZc4SCKRtEnWJE9SOIlLyiEVkbaQ9pNOkW6S+kgfyUpkA7IDOZCcSBaTV5IryPvIJ8k3yc/IQxRViinFnRJO4VPyKespuyitlOuUPsoQVY1qTvWkRlPTqSuoldQG6nnqQ+o7JSUlIyU3pVlKIqXlSpVKB5UuKvUofaKp06xofrQkWi5tHW0P7TTtHu0dnU43o/vQE+k59HX0OvpZ+mP6R2WGsq0yR5mvvEy5WrlJ+abyaxWKiqkKW2WuSoFKhcphlesqr1Qpqmaqfqpc1aWq1arHVLtVB9UYavZq4WpZamvV9qldUnuuTlI3Uw9Q56sXqteqn1XvZeAYxgw/Bo+xirGLcZ7Rp0HUMNfgaKRrlGgc0OjQGNBU15ymGau5ULNa84SmnIljmjE5zEzmeuYhZhfz8yS9SexJgklrJjVMujnpg9ZkLR8tgVaxVqPWHa3P2iztAO0M7VLtZu1HOngdK51ZOgt0tuuc13k1WWOyx2Te5OLJhybf10V1rXQjdRfp1upe1R3U09cL0pPobdE7q/dKn6nvo5+uX65/Ur/fgGHgZSAyKDc4ZfCCpcliszJZlaxzrAFDXcNgw1zDnYYdhkNG5kYxRiuNGo0eGVONXY1TjcuN24wHTAxMZpgsNqk3uW9KMXU1FZpuNm03/WBmbhZnttqs2ey5uZY5x7zAvN78oQXdwttivkWNxW1LoqWrZYblNssbVqiVk5XQqtrqujVq7Wwtst5m3TmFMMVtinhKzZRuG5oN2ybPpt6mx5ZpG2a70rbZ9vVUk6mJU0untk/9Zudkl2m3y+6Bvbp9iP1K+1b7tw5WDjyHaofbjnTHQMdlji2Ob6ZZTxNM2z7trhPDaYbTaqc2p6/OLs5S5wbnfhcTl2SXrS7drhquEa5rXS+6Edx83Za5HXf75O7snuN+yP0PDxuPDI99Hs+nm08XTN81vdfTyJPrudNT7sXySvb60UvubejN9a7xfuJj7MP32e3zjG3JTmfvZ7/2tfOV+h71/eDn7rfE77Q/zj/Iv9i/I0A9ICagKuBxoFFgWmB94ECQU9CioNPBhODQ4NLgbo4eh8ep4wyEuIQsCTkXSguNCq0KfRJmFSYNa52BzgiZsXHGw5mmM8Uzm8MhnBO+MfxRhHnE/IhfZhFnRcyqnvU00j5ycWR7FCNqXtS+qPfRvtHrox/EWMTkxrTFqsQmxdbFfojzjyuLk8dPjV8SfyVBJ0GU0JJISoxN3J04ODtg9qbZfUlOSUVJXXPM5yycc2muztzMuSfmqczjzjucTEiOS96X/IUbzq3hDqZwUramDPD8eJt5L/k+/HJ+v8BTUCZ4luqZWpb6PM0zbWNav9BbWCF8JfITVYnepAen70j/kBGesSdjODMuszGLnJWcdUysLs4Qn8vWz16Y3SmxlhRJ5PPd52+aPyANle6WIbI5spYcDaw5upprkftdbk+eV1513scFsQsOL1RbKF54Nd8qf03+s4LAgp8W4RfxFrUtNly8YnHPEvaSnUuRpSlL25YZLytc1rc8aPneFdQVGSuurbRbWbbyz1Vxq1oL9QqXF/Z+F/RdfZFykbSoe7XH6h3f478Xfd+xxnHNljXfivnFl0vsSipKvqzlrb38g/0PlT8Mr0td17Heef32DcQN4g1dpd6le8vUygrKejfO2NhUziovLv9z07xNlyqmVezYTN2cu1leGVbZssVky4YtX6qEVXeqfasbt+puXbP1wzb+tpvbfbY37NDbUbLj84+iH+/uDNrZVGNWU1FLrM2rfbordlf7T64/1e3W2V2y++se8R753si95+pc6ur26e5bX4/W59b370/af+OA/4GWBpuGnY3MxpKDcDD34Iufk3/uOhR6qO2w6+GGI6ZHth5lHC1uQprymwaahc3yloSWzmMhx9paPVqP/mL7y57jhserT2ieWH+SerLw5PCpglODpyWnX51JO9PbNq/twdn4s7fPzTrXcT70/MULgRfOtrPbT130vHj8kvulY5ddLzdfcb7SdNXp6tFrTteOdjh3NF13ud5yw+1Ga+f0zpM3vW+eueV/68Jtzu0rd2be6eyK6brbndQtv8u/+/xe5r039/PuDz1Y/pDwsPiR6qOKx7qPa361/LVR7iw/0ePfc/VJ1JMHvbzel7/JfvvSV/iU/rTimcGzuucOz4/3B/bfeDH7Rd9LycuhV0W/q/2+9bXF6yN/+PxxdSB+oO+N9M3w27XvtN/t+XPan22DEYOP32e9H/pQ/FH7495Prp/aP8d9fja04AvpS+VXy6+t30K/PRzOGh6WcKXc0VYAhw00NRXg7R4AegIA4wYAdfZYTz0qZOw7YJTgP/FY3z0qZ4DaboDoRQBh1wC2VGEtLRZfJQkgQgWzewDq6KgY/5Qs1dFhLBbNG2tNHg0Pv7MAIJUCfC0dHh6qHR7+Wost9gHA6fyxXn5E+th3xWwKEOMbulaUSuBf9A9h0xNBGrcskQAAAK5QTFRF////6+vrtbW1wsLCxMTEw8PD1NTUurq6vb29x8fH8PDw9+7u+PDv9uzs9+3t9uvq8+jo9+3s9uvr9Onp+PHw9uzr+PDw9erq9+7t+O/v//7+/Pz85O799fX15OTk5+fn6Ojo/f39+vr67u7u7+/v7e3t+/v79PT04+Pj5ubm5eXl6enp8vLy8fHx/v7+7Ozs9vb26urq+fn5+LSL9qJu966A96x9+9jC+s6z+s60Bk9+ywAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtNjVbRPkAAACgSURBVCjPnY3ZEoIwDACpt62INypqKWmLHJ6o4P//mE8wdozHuE+ZZGdjWX9CavVGs9XudOlbhfVs1nfYYOiw0Xgynbnzhe0uEdFbrTec+8LAQ0RhBRQoSCWVeFq+ooNwG/E40QZ4MQVJFACodEc/FnkUUf29uNdwICCp+QYrHglJTuEPxbNPYmI2sKJAQcTsUnK9VWOGiHlRcq+mIq/OD4spH7BJYTEdAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAyNzA01wmN9gAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTQ0ti/xvgAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIwCrresAAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spawner-op\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=676 676w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=1352 1352w,\nhttps://images.ctfassets.net/tushy4jlcik7/4Jrhk4lMCRaiiE5mF8cbXX/7162ec3e96318c1ba6fb018d01008b53/spawner-op.png?w=2704 2704w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>singleUser는 사용자의 노트북 환경을 의미하며 사용자는 미리 정의된 프로필(이미지)을 선택하여 원하는 노트북 환경을 생성할 수 있습니다. 위 아키텍쳐에서는 <strong>PV, PVC를 통해 사용자에게 개인, 공용 볼륨을 할당</strong>해주었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">profileList</span><span class=\"token punctuation\">:</span>\n  <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">display_name</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Python Notebook\"</span>\n    <span class=\"token key atrule\">description</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"Spec: CPU 2, Memory 4G / Spark 3.1\"</span>\n    <span class=\"token key atrule\">kubespawner_override</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">image</span><span class=\"token punctuation\">:</span> jupyter/python<span class=\"token punctuation\">-</span>notebook<span class=\"token punctuation\">:</span>hub<span class=\"token punctuation\">-</span>1.4.2\n      <span class=\"token key atrule\">cpu_limit</span><span class=\"token punctuation\">:</span> <span class=\"token number\">2</span>\n      <span class=\"token key atrule\">mem_limit</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"4G\"</span>\n      <span class=\"token key atrule\">cpu_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token number\">1</span>\n      <span class=\"token key atrule\">mem_guarantee</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"2G\"</span>\n      <span class=\"token key atrule\">environment</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">TZ</span><span class=\"token punctuation\">:</span> Asia/Seoul\n      <span class=\"token key atrule\">lifecycle_hooks</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">postStart</span><span class=\"token punctuation\">:</span>\n          <span class=\"token key atrule\">exec</span><span class=\"token punctuation\">:</span>\n            command<span class=\"token punctuation\">:</span></code></pre></div>\n<p>프로필에는 리소스 뿐만 아니라 lifecycle_hook, environment 등 K8S의 다양한 리소스를 함께 정의하여 유연하게 구성할 수 있습니다. 노트북 기본 이미지는 <a href=\"https://github.com/jupyter/docker-stacks\">jupyter/docker-stacks</a> 저장소로부터 생성한다면 편하게 패키지 의존성을 관리할 수 있습니다.</p>\n<p><strong>resource guarantee</strong><br>\nresource guarantee는 모든 사용자가 최소한 <code class=\"language-text\">_guarantee</code> 만큼의 리소스를 사용할 수 있으며 최대 <code class=\"language-text\">_limit</code> 만큼의 리소스를 제공받을 수 있음을 의미합니다. 예를 들어 사용자에게 2G의 RAM이 보장되는 경우, 사용자는 2G 이상의 RAM을 사용할 수 있습니다. 문서에서는 guarantee 값을 limit의 반으로 설정하는 것을 권장하고 있습니다.</p>\n<br>\n<h2 id=\"idle-culler\" style=\"position:relative;\"><a href=\"#idle-culler\" aria-label=\"idle culler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Idle Culler</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">cull</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n  <span class=\"token key atrule\">timeout</span><span class=\"token punctuation\">:</span> <span class=\"token number\">86400</span>\n  <span class=\"token key atrule\">every</span><span class=\"token punctuation\">:</span> <span class=\"token number\">600</span>\n  <span class=\"token key atrule\">concurrency</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span></code></pre></div>\n<p>idle-culler는 일정 주기 동안 미사용된 노트북 리소스를 정리합니다.\n이를 통해 노트북 리소스를 최적화하여 운영할 수 있습니다.\nidle-culler를 활성화하면 JupyterHub Service에 등록되며 이후 JupyterHub API를 통해 사용자 활동을 주기적으로 확인합니다.</p>\n<br>\n<h2 id=\"user-scheduler\" style=\"position:relative;\"><a href=\"#user-scheduler\" aria-label=\"user scheduler permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>User Scheduler</h2>\n<p>user scheduler는 노트북 리소스를 적절한 노드에 할당하기 위해 추가되었습니다.\n기본 K8S 스케줄러는 여러 노드에 분산하여 리소스를 할당하지만, user scheduler는 가장 리소스를 많이 점유하고 있는 노드에 리소스를 할당합니다. 이를 통해 <strong>Cluster AutoScaler, idle-culler와 연계하여 노트북 리소스를 최적화하여 운영</strong>할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 51.3405362144858%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAIAAAC7eDtJAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC02NVtE+QAAAxJJREFUGBm9wVGPE2UYhuH7eb9vZtru0i5IIjEmGMO5Rxr//+/w2ANNhLC77XZmvvexC2wFpAVi4nXp519+BU3TdLu9xZ+B38CfhP/xaL2utbZ57vvBNmDcMQm/3uXrJ9/rhx9fhLS/ebXcPN2+/KOVgf9F7Uo8GgaWz4D1t9/xMUk2YD6yXK2A3XbHPXOOwByJ691dnae2HMRpRUpj/mW7A5aAhDlHwhwJrltWO81JAmOMESfINufINu8IsIGKdL0fOa0UMm2LEyRsEJhPkrA5KrXMmRV02xqnVcikrq88z93Qh3J3c7daX7Rxn92q7bal721HqTmN436Ws/ouLjY1aK2ZwJkEbY4Sme4vF4z7ms4gOM2wWmhzVUu3wG7J1aK5L86FirwaStfZbrHw3Ds65l3etGHTgUQSVU6jnPbqBjmNrvuu2uY8IzDMU1PIZlZfDAq3zP7SCrc5qer7nKZS+1aWKnVqEZ6YmyKCTEstXQeIdNSI4CwJCRDgNKB+RbsDrEj1kaNVhWyiFKt2jzZTQoQTZCucswoH7i6YR0PFfJbEkRWOjnbn6KyQExUU2LI5sCm9bQ6UCAiHIhPbc5OKcLXNh8pBME6t62qaIq9Wg7EQkGVlZJTRWwUbhTN5j8CAjQoIhVWtGvOtsWxM7YsQtaqvGvrh+TdXYymXy4s23imi1P52mne3L28RYBVHlTPrChWQBFgSHxIggbhncWCiEyAOqkr56cXzv3Y3j6822o+1W1SUral0QGttVSmXj+/2Y5v3rkvZHETFFubLqbTayckbYVP7/tnmSZdRuwX3zPtMLy67Qf36aV+6MAc2X09OHlQfZDZOE4Z15ap4hil4lbY5kmSb0yTZ5oG4VwFJnOMI2TQkuAhvQ2PyPkmcJYkjGQhJfI0qrQt9IP6TypcQmKOLUJEn2CdpJNI081ZLks+r6bTNGcIHyDYPBljAKmggSEjumXt7e2wcNTQ280Dcqyh++/1PFJi0JQTOpqiInOfaFVtTyyIB2+2Wt4QQYCwJY8yBMe9IQtgGAbYlMONu9zdh2RHOof4F1AAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"user-scheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=625 625w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=1250 1250w,\nhttps://images.ctfassets.net/tushy4jlcik7/3qNbciBgdcZkpDehv68qg6/0f8ed9b319612f669c17f2dbd359ff2e/user-scheduler.png?w=2499 2499w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>예를 들어 일반적인 설정이라면, pod가 다양한 노드에 분산되어 클러스터 scale-in 조건까지 도달하기가 어렵습니다. 하지만 user-scheduler를 사용한다면, 위 그림과 같이 노드에 할당된 pod의 수가 점진적으로 줄어들게 됩니다.</p>\n<br>\n<h2 id=\"image-pre-puller\" style=\"position:relative;\"><a href=\"#image-pre-puller\" aria-label=\"image pre puller permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Image Pre Puller</h2>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">prePuller</span><span class=\"token punctuation\">:</span>\n  <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">requests</span><span class=\"token punctuation\">:</span>\n      <span class=\"token key atrule\">cpu</span><span class=\"token punctuation\">:</span> 10m\n      <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 8Mi\n  <span class=\"token key atrule\">hook</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">enabled</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span>\n    <span class=\"token key atrule\">pullOnlyOnChanges</span><span class=\"token punctuation\">:</span> <span class=\"token boolean important\">true</span></code></pre></div>\n<p>Image prePuller는 사용자가 노트북을 실행하기 전에 노드에 미리 이미지를 준비하여 노트북 환경 생성 시간을 단축시켜 줍니다. 예를 들어 CA에 의해 노드가 새로 추가된다거나 새로운 이미지가 프로필에 등록된 경우, 미리 노드에 프로필 이미지를 pull 하게 됩니다.</p>\n<br>\n<h2 id=\"monitoring\" style=\"position:relative;\"><a href=\"#monitoring\" aria-label=\"monitoring permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Monitoring</h2>\n<p>JupyterHub는 <code class=\"language-text\">/metrics</code> endpoint를 통해 prometheus 메트릭을 지원합니다. 주요 지표로는 활성 사용자 수, 노트북 서버 생성까지 소요되는 시간 등이 있습니다. 사용 가능한 전체 메트릭은 <a href=\"https://jupyterhub.readthedocs.io/en/stable/reference/metrics.html\">JupyterHub 문서</a>에서 확인하실 수 있습니다.\n또한  <a href=\"https://github.com/jupyterhub/grafana-dashboards\">jupyterhub/grafana-dashboards</a> 저장소를 통해 미리 정의된 운영 대시보드를 제공합니다. 이를 통해 쉽게 모니터링을 구성할 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html\">https://zero-to-jupyterhub.readthedocs.io/en/latest/index.html</a></li>\n<li><a href=\"https://jupyterhub.readthedocs.io/en/stable/index.html\">https://jupyterhub.readthedocs.io/en/stable/index.html</a></li>\n</ul>","excerpt":"일반적으로 JupyterHub를 Kubernetes 환경에 배포할 때 Helm Chart를 많이 사용합니다.\n이 글에서는 zero-to…"}}},{"id":"daa589cd-f055-5aef-94ee-0b0b8d1505a0","title":"Spark on Kubernetes: 커스텀 스케줄러 (1)","slug":"spark-on-kubernetes-scheduler","publishDate":"June 08, 2023","publishDateISO":"2023-06-08","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":3,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n그래서 오늘은 커스텀 스케줄러가 왜 필요하고 어떻게 적용할 수 있는지 정리해보려고 합니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-kubernetes-scheduling\" style=\"position:relative;\"><a href=\"#spark-kubernetes-scheduling\" aria-label=\"spark kubernetes scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Kubernetes Scheduling</h2>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.66526019690576%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAABNVBMVEX////+//+Ur+y3yfL8/Pz09/1UfuF5mub29vb39/fm6/br7vX4+Pje5POswO309PTp6eng4OGbtO3V4Pikuu3o6Ojo6u+Oquu9zfOVr+u5wdSYqtbW2uPk5OTq6urJ2PKrw+7a4/OqwuyOr+quxe27yu+juu7G0/G2x++kuu7J1fHr7/WrxPCgvO2nwOzX2Npfj+HJ2fVikeLq6+umvO/Z4vilu+7l5eXY2NjT1dqqv/D09faeuux3n+bE1PHt7e3Nzc3T09PPz8/19vZ5oOVRhd+ApeaOqumBoOmhuOyJpumAn+move3j5OTHyMr19fXs7OzKy82+wsnLzM3z8/Pc3d3Iyczq6uvFxsbJys3Z2dn19faYseynvO+uwu7y8vLR1Nqft+7i6fqsvueFo+fR2vH5+fnP3Dq1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMxJREFUKM9jYKAFYGRiZsELYApZ2dg58AFOuJFc3EQq5OGgWCEvHzcRCvkFBIWERYhQKMohJi4hSZRCDilpGeIUysrKoSmUV1CEyCopq4AoVTV1kEINTS1Uhdo6unqiAkCgb2BoZAykTEzNzC0ELK1MzVAVWtvY2tk7ODqZO7u4uoFMdPfwBJpo7eXtg2a1r58/2OaAwKDgECAdGhYOsjoiMoo4z0TzchCnMCY2jgiF8QIJiUkxxMV1ckoqcQodHKLISmZpnHgBD0kZCwD/XiggmoGiiAAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTQyMhyvW/YAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADgyMOba+BYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"spark-k8s\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=356 356w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=711 711w,\nhttps://images.ctfassets.net/tushy4jlcik7/3rf4qupMJ99w5THRe8OkYy/3f71d3caf42909aaf305df3d5a64836e/spark-k8s.png?w=1422 1422w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>쿠버네티스 환경에서 spark-submit을 실행하면 pod가 실행되는 순서는 다음과 같습니다.</p>\n<ul>\n<li>spark-submit 명령어 실행</li>\n<li>Kube API를 통해 driver pod 생성</li>\n<li>driver pod → API Server에 executor 생성 요청</li>\n<li>Kube API를 통해 executor pod 생성</li>\n</ul>\n<p>위와 같이 driver가 executor를 관리함에 따라 동적으로 리소스를 확장할 수 있지만\ndriver가 생성되기 전까지 전체 executor에 필요한 리소스를 알 수 없다는 단점이 있습니다.\n이러한 이유로 클러스터 내에 리소스가 고갈된 상황에서 성능 문제가 발생할 수 있습니다.</p>\n<br>\n<p><strong>클러스터 내에 리소스가 고갈된 경우</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 57.38461538461538%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAIAAAD2sJpCAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA8tJREFUSMfFlWlv20YQhvP/PxVoWrQokLZO4MaxEke2rMvULVmiDlqiDov3kru8lpRIynYaH0k7DFPXaGuUToJ28WIx72gxD2egxT767X9aj/6euv7S6+bmJhX4/OLcD6m7phJxIfhDnmA4sK8ib+PYZ66DFSuw4iARNWxHt25tBE7+aN9sNmnBukO3KyTbsY5G1iryQbt1cnBs7dTIOvKhVruLi1X8qqBbyD6n7nxqHjI4X8HjsQnWJ07mUC/VcK2Fwf472PM8Qojne52pPUcr5Aa7dROolu8DFWyetQn1AJwt6bbhI5my/bj0fgmdeWtK/P2SDpafmIu5Cwf2y0Yq8OXlpW3b0SZy1943r/WvMqg5sZOOd6r48Z6+XcFJx8MR+faZ8sNzJbBcKE1UG+zXW7ImWmAjx32yq363rcBgUoFvRw2kyXzM8SOLmgm4N+yCHU2GCXjJjWZ9dsr2VjjuCS3mEEPGlESwrqbyve580Fem/IPB9ykBQ7n0Sgte+9ShpuPdI0rWWA+IkV6R76UC+9S2XdweG68aumxgiEG8hF9U0UTEtmOsdI1IKF9W2Z62NhDIQ6jWUJmaSjWUZO4K7mZa8Fgw6hNXwKvXrQRMMg1TMteZpmk5GMAFBmkyHQzt2TguXa2rqkRlkTI17VPApml2u11ZOO3PDbg5nOQ9LRsANiyyVcK86j89wojE4N2cNps69bbJDWNSkVGnvMOd2Lmy+lkdAyzbELcKiqAZyahbnLRVVNpjNRm1PBV3smK5IkEMpS1JzOalzIHgatrngmeLyYDr6VhJwINRdzDqDU/YBCxyQ/64DXJkEUrri9m43Zx2OxB8OjjwTZfqLjXukR4YSoi19Nr4dhrw++sLeRNJH3Qb/GnPIvGtu7iky0sqfNjvSvhHe73R04I9X95r6S+bpD9XE2q5j+AvXWJRAuZPpNyRnmfUiMTViSweHiGQthTBXthCgVFzRwY3lFKBr66u3r27eRMuhwtlovgLfZXtEKD6KyXXi5+NAmvDNwG4WEWKSCXBHY9iUpERfdPHmleqyGCFmcjzDhwoVo1UYHid+iy7dibYlr8/0LfK5KCjATgM5R8L2i9V8iSvhYEEYKYmPd9HP2VUR43Bp7z4bA/9/FIbc3GLK0OEn3Zz+mFZftioAdYftZlWE57aZNRdlqm0m4NRIxm1zNVbTG3QrGwwD6Wt0263Wjmu1jx5AHatccMGAwcQ33kYOAyFMIgVhR8VBssgWMK+CYVf7fmt3joL0J3M4i8ZiK83KNV1en8dfmHdnKUC/zfrd/tF7YCMkFTrAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMzAwxdhO3QAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANzQ2Ur+9mAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=325 325w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=650 650w,\nhttps://images.ctfassets.net/tushy4jlcik7/5hTv6QcJdxi9F4JDlfuX4K/4a9eafde5ae7f235163148ffd7de6e2c/allo1.png?w=1300 1300w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>클러스터의 리소스 풀이 요청 받은 리소스보다 부족한 상황이라고 가정해보겠습니다.\n위 그림에서 녹색은 실제로 노드에 할당되어 running 중인 pod, 빨간색은 리소스가 부족으로 인해 pending 상태의 pod 입니다.</p>\n<p>각 앱은 리소스 경쟁에 의해 driver와 executor 1개씩 정상적으로 생성되어 3개의 앱이 실행 중인 상태입니다. 하지만 3개의 앱은 executor 리소스를 확보하지 못했기 때문에 작업을 완료할 수 없습니다. EKS 환경이라면 노드 리소스를 확보하더라도 VPC IP 고갈 문제로 인해 이러한 상황을 충분히 마주칠 수 있습니다.</p>\n<br>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.129659643435986%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAIAAAAH5iiXAAAMYGlDQ1BpY2MAAEiJlVcHWFPJFp5bkpCQ0AIRkBJ6E0R6kRJCiyAgVRCVkAQSSowJQcWOLiq4dhHFiq6KKLoWQBYVsZdFsffFgoqyLhYUReVNCui6r3zv5Js7f86c+U+5M/feAUC7lyuR5KE6AOSLC6TxESHMsalpTNIzgCh/GNDh8mQSVlxcNIAy0P9d3t+AllCuOiu4/jn+X0WPL5DxAEDSIc7ky3j5EDcDgK/nSaQFABAVeqspBRIFngOxvhQGCPEqBc5W4Z0KnKnCTUqbxHg2xJcB0KByudJsALTuQT2zkJcNebQ+Q+wq5ovEAGgPgziQJ+TyIVbEPiw/f5ICV0BsD+0lEMN4gE/md5zZf+PPHOTncrMHsSovpWiEimSSPO60/7M0/1vy8+QDPmxhowqlkfGK/GENb+VOilJgKsRd4syYWEWtIe4V8VV1BwClCOWRSSp71IQnY8P6AQbErnxuaBTEJhCHi/NiotX6zCxROAdiuFrQqaICTiLEhhAvFMjCEtQ2m6WT4tW+0LosKZul1p/lSpV+Fb4eyHOTWGr+N0IBR82PaRUJE1MgpkBsXShKjoFYC2IXWW5ClNpmZJGQHTNgI5XHK+K3hjheII4IUfFjhVnS8Hi1fWm+bCBfbLNQxIlR4/0FwsRIVX2wkzyuMn6YC3ZZIGYlDfAIZGOjB3LhC0LDVLljzwXipAQ1T6+kICReNRenSPLi1Pa4pSAvQqG3hNhDVpignosnF8DFqeLHsyQFcYmqOPGiHO6oOFU8+DIQDdggFDCBHLZMMAnkAFFrV30X/KcaCQdcIAXZQACc1ZqBGSnKETG8JoAi8CdEAiAbnBeiHBWAQqj/MqhVXZ1BlnK0UDkjFzyFOB9EgTz4X66cJR70lgyeQI3oH965sPFgvHmwKcb/vX5A+03DgppotUY+4JGpPWBJDCOGEiOJ4UQH3BgPxP3xaHgNhs0N98F9B/L4Zk94SmgjPCJcJ7QTbk8UFUt/iHI0aIf84epaZH5fC9wWcnriIXgAZIfMOAM3Bs64B/TDwoOgZ0+oZavjVlSF+QP33zL47m6o7ciuZJQ8hBxMtv9xppajlucgi6LW39dHFWvmYL3ZgyM/+md/V30+7KN+tMQWYgewM9hx7BzWhNUDJnYMa8AuYkcUeHB1PVGurgFv8cp4ciGP6B/+uGqfikrKXGtcO10/q8YKBFMLFBuPPUkyTSrKFhYwWfDtIGByxDyXYUw3Vzd3ABTvGtXj6y1D+Q5BGOe/6ebBPR4g7u/vb/qmi/oEwEELuP3bv+nsrsDHBHxOn13Ok0sLVTpccSHAp4Q23GlGwAxYAXuYjxvwAv4gGISBUSAWJIJUMAFWWQjXuRRMATPAXFACysAysBqsA5vAVrAT7AH7QT1oAsfBaXABXAbXwV24ejrAS9AN3oM+BEFICA2hI0aIOWKDOCFuiA8SiIQh0Ug8kopkINmIGJEjM5B5SBmyAlmHbEGqkV+Rw8hx5BzShtxGHiKdyBvkE4qhVFQfNUVt0eGoD8pCo9BEdDyajU5Gi9D56BK0Aq1Cd6N16HH0AnodbUdfoj0YwDQxBmaBOWM+GBuLxdKwLEyKzcJKsXKsCqvFGuF9voq1Y13YR5yI03Em7gxXcCSehPPwyfgsfDG+Dt+J1+En8av4Q7wb/0qgEUwITgQ/AocwlpBNmEIoIZQTthMOEU7BvdRBeE8kEhlEO6I33IupxBzidOJi4gbiXmIzsY34mNhDIpGMSE6kAFIsiUsqIJWQ1pJ2k46RrpA6SL0amhrmGm4a4RppGmKNYo1yjV0aRzWuaDzT6CPrkG3IfuRYMp88jbyUvI3cSL5E7iD3UXQpdpQASiIlhzKXUkGppZyi3KO81dTUtNT01RyjKdKco1mhuU/zrOZDzY9UPaojlU1Np8qpS6g7qM3U29S3NBrNlhZMS6MV0JbQqmknaA9ovVp0LRctjhZfa7ZWpVad1hWtV9pkbRttlvYE7SLtcu0D2pe0u3TIOrY6bB2uziydSp3DOjd1enTpuiN0Y3XzdRfr7tI9p/tcj6Rnqxemx9ebr7dV74TeYzpGt6Kz6Tz6PPo2+il6hz5R306fo5+jX6a/R79Vv9tAz8DDINlgqkGlwRGDdgbGsGVwGHmMpYz9jBuMT0NMh7CGCIYsGlI75MqQD4ZDDYMNBYalhnsNrxt+MmIahRnlGi03qje6b4wbOxqPMZ5ivNH4lHHXUP2h/kN5Q0uH7h96xwQ1cTSJN5lustXkokmPqZlphKnEdK3pCdMuM4ZZsFmO2Sqzo2ad5nTzQHOR+SrzY+YvmAZMFjOPWcE8yey2MLGItJBbbLFoteiztLNMsiy23Gt534pi5WOVZbXKqsWq29rcerT1DOsa6zs2ZBsfG6HNGpszNh9s7WxTbBfY1ts+tzO049gV2dXY3bOn2QfZT7avsr/mQHTwcch12OBw2RF19HQUOlY6XnJCnbycRE4bnNqGEYb5DhMPqxp205nqzHIudK5xfujCcIl2KXapd3k13Hp42vDlw88M/+rq6Zrnus317gi9EaNGFI9oHPHGzdGN51bpds2d5h7uPtu9wf21h5OHwGOjxy1PuudozwWeLZ5fvLy9pF61Xp3e1t4Z3uu9b/ro+8T5LPY560vwDfGd7dvk+9HPy6/Ab7/fX/7O/rn+u/yfj7QbKRi5beTjAMsAbsCWgPZAZmBG4ObA9iCLIG5QVdCjYKtgfvD24GcsB1YOazfrVYhriDTkUMgHth97Jrs5FAuNCC0NbQ3TC0sKWxf2INwyPDu8Jrw7wjNiekRzJCEyKnJ55E2OKYfHqeZ0j/IeNXPUyShqVELUuqhH0Y7R0ujG0ejoUaNXjr4XYxMjjqmPBbGc2JWx9+Ps4ibH/TaGOCZuTOWYp/Ej4mfEn0mgJ0xM2JXwPjEkcWni3ST7JHlSS7J2cnpydfKHlNCUFSntY4ePnTn2Qqpxqii1IY2Ulpy2Pa1nXNi41eM60j3TS9JvjLcbP3X8uQnGE/ImHJmoPZE78UAGISMlY1fGZ24st4rbk8nJXJ/ZzWPz1vBe8oP5q/idggDBCsGzrICsFVnPswOyV2Z3CoOE5cIuEVu0TvQ6JzJnU86H3NjcHbn9eSl5e/M18jPyD4v1xLnik5PMJk2d1CZxkpRI2if7TV49uVsaJd0uQ2TjZQ0F+vCj/qLcXv6T/GFhYGFlYe+U5CkHpupOFU+9OM1x2qJpz4rCi36Zjk/nTW+ZYTFj7oyHM1kzt8xCZmXOapltNXv+7I45EXN2zqXMzZ37e7Fr8Yrid/NS5jXON50/Z/7jnyJ+qinRKpGW3Fzgv2DTQnyhaGHrIvdFaxd9LeWXni9zLSsv+7yYt/j8zyN+rvi5f0nWktalXks3LiMuEy+7sTxo+c4VuiuKVjxeOXpl3SrmqtJV71ZPXH2u3KN80xrKGvma9oroioa11muXrf28TrjuemVI5d71JusXrf+wgb/hysbgjbWbTDeVbfq0WbT51paILXVVtlXlW4lbC7c+3Za87cwvPr9UbzfeXrb9yw7xjvad8TtPVntXV+8y2bW0Bq2R13TuTt99eU/onoZa59otexl7y/aBffJ9L37N+PXG/qj9LQd8DtQetDm4/hD9UGkdUjetrrteWN/ekNrQdnjU4ZZG/8ZDv7n8tqPJoqnyiMGRpUcpR+cf7T9WdKynWdLcdTz7+OOWiS13T4w9ce3kmJOtp6JOnT0dfvrEGdaZY2cDzjad8zt3+LzP+foLXhfqLnpePPS75++HWr1a6y55X2q47Hu5sW1k29ErQVeOXw29evoa59qF6zHX224k3bh1M/1m+y3+ree3826/vlN4p+/unHuEe6X3de6XPzB5UPWHwx97273ajzwMfXjxUcKju495j18+kT353DH/Ke1p+TPzZ9XP3Z43dYZ3Xn4x7kXHS8nLvq6SP3X/XP/K/tXBv4L/utg9trvjtfR1/5vFb43e7njn8a6lJ67nwfv8930fSnuNend+9Pl45lPKp2d9Uz6TPld8cfjS+DXq673+/P5+CVfKVX4KYLChWVkAvNkBAC0VADo8t1HGqc6CSkFU51clAv8Jq86LSvECoBZ2is94djMA+2CznQO5YVN8wicGA9TdfbCpRZbl7qbiosKTEKG3v/+tKQCkRgC+SPv7+zb093/ZBoO9DUDzZNUZVCFEeGbYHKBA1w3Te8EPojqffpfjjz1QROABfuz/BVyMj8u941sgAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAA+VJREFUSMfFlvtT2lgUx/v//wvbWWdn7ExbfIAUoYAQIUFThQhCknvzfj8gvLSCiNgTL7Zd65i26+5mzg/ne87nnu/cm9yZvLr7n55XP5Zu/50nwRiIi8uL4SR62ZheTlerVaLx1Ar7adpJHTos70eTAcQx76coJ8M40ALpR4M9xnlPOfS5R4Am9rcOnV3a0dwQZH88+HDkvKs6VS4GJheT54zBdblcgnGFcwUj4o1op+6QuZCAhGKVc0Gygn+K+1DZrv0NMILRhyMbZFcLap0AKru0G46SjLvdLsuyYMxJ/mbZzjbczZJF5kISy7INLZCCEWwUrBzrbeTNwT2Qouzdugun0ujGW1Td8PW+mf/kvc6ZwTDJ+OtRw8oDVshQgumvT7KL0V5NrJ6I/iCu2L5Va4rZOupKMgGQKu0dCmUWef34SNzQYTgxW0OcgJOP+ntj3dawisJhQOaqpiJpGCliEMU7BnvoyroEdQIYjg5dYIgxYJADoxjyzxkvl5PJqD8KXzbGk2GC8c3Noh+6XmDdh/2QPCkfV9wngHWEgfPoKj9tLJtWirLgOlEtk6yEBOQWZUELpOFYkMOnVDpZA0wHABtWCeqvG8Ndms2uACqyBrKjnh5fJ7ISEpBQhBZIum1y8uABiDe6U7Ph8lj9Ubqm/7Jxr9drMIxj6y3R2shbWzXnTckgKyEBCUVogewp1h85E+7oRn4NbFHG24qzWbIbHfP3jxrQMsPtFE9VQyUrWx0uU+GgaFgKSEXHlUYrS3VanTYBzvl2+qBVYtqaIf0jY0XDkio63npDsipiRRBxl1QsR8MyDyFriADAI4lHMg+t3zFe3lxPh/YoMl42JkN79bzx3e38ZoLnPj8PhEtXjJOHiGUgfKsE/A+AMPOFx0vuk8UY3a2WycahjtN5LVs02WPpOhQhIAEJxb6OQY5tlM6r2ZJZp2UCcE0AjHRBt+UYuPJRpqAAUKYUkIsxfs54sVhcz6bXY8Qw2NL6Cg5zZYPMzZUMGYdQhBbIsyZGQiChcL9szkN0D+iqFEZu9PEgBqQe5s48SQyKVevSwwnGgiCcfmpchl0d4b+2te19Y6+w3lCmIIOEooHiub6KN1JqumC+zwIQGxcr8rus/iati+cxMDTxnyll76O5uSvPApRg/PWoYWWTaVSL9bF5ToyVM7peOTqlmanViedqrRZDMxSrtBsEsHqN2gFzQh+NdC5+F2a7fUzT1WPUpJOP+nvjidkeG2fwsZC5MA7MBmpz5vMgP7u9SGsNNQ4YAozNs0htQfHK68Xv2OOBj9QmAX7CeLW4nQfLz97LBsy8W90m/GX+N88XdRNR/uKneMQAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEyMzToWrMwAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA3NDJV0nmBAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"allo2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=309 309w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=617 617w,\nhttps://images.ctfassets.net/tushy4jlcik7/6U6rRqyACQNSOLT8tqXN40/5d69b571b23d34fdeac29a067e680ecc/allo2.png?w=1234 1234w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위와 같이 리소스 내에서 가능한 앱이 정상적으로 실행, 종료되고 나머지는 대기하는게 더 효율적이라고 볼 수 있습니다.\n쿠버네티스에서는 기본 스케줄러가 배치 작업에 최적화된 형태가 아니기 때문에 위와 같은 문제가 발생할 수 있습니다. 이를 해결하기 위해 <code class=\"language-text\">kube-batch</code>, <code class=\"language-text\">volcano</code>, <code class=\"language-text\">yunikorn</code> 등의 커스텀 배치 스케줄러가 개발되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-app-aware-scheduling\" style=\"position:relative;\"><a href=\"#spark-app-aware-scheduling\" aria-label=\"spark app aware scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark App-aware Scheduling</h2>\n<p>기본 스케줄러는 <code class=\"language-text\">filtering</code>, <code class=\"language-text\">scoring</code> 과정을 거쳐 pod가 실행될 최적의 노드를 찾습니다. 이 때 스케줄 단위는 pod 입니다. 반면 대용량 배치 작업에서는 동시에 수 백개의 pod가 생성되기도 합니다. 또한 동시에 여러 작업이 실행되기 때문에 우선순위, 조직 별 리소스 제한 등을 고려해서 안정적으로 작업을 마치기 위한 대기열이 필요합니다.</p>\n<p>커스텀 배치 스케줄러에서는 이를 해결하기 위해 <strong>앱 단위로 스케줄을 결정하는 App-aware 방식을 사용</strong>합니다. 뿐만 아니라 대용량 배치 작업을 위해 Job Ordering, Hierarchy Resource Queue, Node Sorting 단계에서 다양한 스케줄링 알고리즘을 지원합니다.</p>\n<p><strong>Bin Packing</strong><br>\n<span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 30.321406913280775%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAMAAAAnHQ9/AAABWVBMVEX////9/f/8/f709PTB0PU7b+rE0/h+o+Fpls5umNzz8/PB0fgzaenB0vikw8622Kicv8Xg4ODV1dXc3Nzk5OTq6urE37m22Knb29vW1tb29va62q1Bc+o7nIVFtF9Uumw/slqV1KP5+fn7+/v19fX6+vqBtK6KxJiXx6ODwpLk9Ojw8PC/z/U4aOMQi18DmycKni0AmiVzx4fu7u7n5+fW1db+/v6Ws9KbuLFqnqywxbXT09PR0dGgwafd8eHG0PHYRDkhi1gcnSF4x4X39/fx8fG0epfYRTqOWWWIt3qfvYmfvYh8tHLG0PLdYFXdX1V9lUr1tgf1vB71tAKkzIDhdGvZSj/TsAf1uhf1uA7ArgnG0PO+SlV5lUzttQrtvCLtswOizICnfaW9SlZ+XXbLrwjsuRjsuBW5rQrx9f3S3vrL5tzI6c/h8+Xd5vvT3/rS4PTJ6dD4/Pl4L/NBAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAK9JREFUGBkFwbEuQ2EAgNHz8XNFuNXJYmCUGMXqwcVitLOwSCRWSjTtIM4JAACAwh/AALuFtgBgP1oDDDAV2gKAKVoD7AAAAAAADMuqXwAAMLUBMIzd+gwAAOz9BCBwWCc+l1VVL2CO01LPGOCiWFZVvd88wmVUFQzwdBuK3s4/ru7AYjttDqpWMID5e+5rUXX/6gkwza3magUDmBccVwXAWcxVYABzKALgKArXD/gHwm4dbOjBtmsAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"bin1-side\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=412 412w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=825 825w,\nhttps://images.ctfassets.net/tushy4jlcik7/3xq1IvNaIvGo5GFGfrSFMe/54bbe46c1b6d52eba037c74c98830f16/bin1-side.png?w=1649 1649w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Node Sorting 단계를 예시로 들어보겠습니다.\n기본 스케줄러에서 driver, executor pod가 여러 노드에 고르게 분산하면 앱은 네트워크 지연, 셔플 시 원격에서 데이터를 가져와야 하는 상황이 발생합니다.</p>\n<p>이 때 테트리스처럼 <strong>Bin Packing 방식을 적용한다면 어플리케이션을 최대한 가깝게 할당</strong>할 수 있습니다. 클라우드 환경에서 이를 적용하면 노드 scale-in도 원활하게 수행할 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"spark-gang-scheduling\" style=\"position:relative;\"><a href=\"#spark-gang-scheduling\" aria-label=\"spark gang scheduling permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Gang Scheduling</h2>\n<p>앞서 리소스가 고갈된 상황의 경우, Gang Scheduling을 사용한다면 안정적으로 작업을 실행할 수 있습니다. 노드가 0대인 상황에서 앱이 제출되었다고 가정해보겠습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 55.70228091236494%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAMAAACFUC6CAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABGlBMVEX////x8fH8/Pzc29v+/v74+Pje3t7r6url5OTn5+fw8PDf3t7l5eXi4uLd3Nz39vf19fX09PT9/f3v7+/o5+j7+/vq6enu7e3x8PHx8PDu8uz6+vr39/ft7e3p6enT4cmqv5n19vPk5OTAyrjD07fq7+bq6urZ2dny8vLs7Ozu7u739vb5+fnQ0NDr6+v29vbKysr4+Pfm5uatra3Lysrs6+vv7u77+vrt7Ozl5eS7u7vDvb/HxsbHxsfX1tfT1NO7zK3BwMHGxsbV1dW9y7HCvrvZ2NjJycnn5ubu7e7p6Ojp5+jRys3q5+jv7u+9vb3z8/Pc3Ny5ubnw7u/u7O3BwMDY1Nbb29vY1NX49/f29fbm5eXj4uPc29y8Y0MOAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARZJREFUGBmtwWk3AlEAgOF30rVMQ5QrzMhemYmxRfa9rCm78P//BtPNMXdOzvHB8/B3Roy/6YrTgeju6e0zCUvE6cgiop/OLCIGCCSNwSEjRUiaiGECciQzOiYJMQiM23xzUCbQZQlMTk3TJlBm0PXyxZqdm6fNQbHQ5YB0vrDgeigeionOhOIixpKgzUcx0WWILxO2grKKbi29LgkTKBYgS7nMRnazb6G8FTe2C2gclDL4O7u7e/sHh0fHJ6dnlSw6H8UkVj2/iIF7KeDq+oYIh5barV2NlVzANYB6WRLhoDTuJD/qtZxE58vkvXwoykef36UAu1F5en7JN1zfe3UComgXhRBOi9dsel7CtQm8vRsf5/yXTyziHHPRsAFEAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNjY2fCqOhQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTI46cMaEwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=417 417w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=833 833w,\nhttps://images.ctfassets.net/tushy4jlcik7/5OoSnJUq9bkaVk3GvARGZJ/37cf098eb06188b68341765956768a71/gang1.png?w=1666 1666w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 기본 스케줄러를 적용했을 때 모습입니다.<br>\n필요한 최소 리소스가 미리 정해져있으나 노드 생성까지 대기 시간이 발생합니다.</p>\n<ul>\n<li>driver 리소스 요청 → 1대 생성</li>\n<li>executor 리소스 요청 → 2대 생성</li>\n</ul>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 56.89252336448598%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAXCAMAAABODP0nAAAKzmlDQ1BpY2MAAEiJlZcHVJNZFoDf/6c3WkKkE3oTpBNASuih9yYqIQkklBgTgogdGRzBsSAiAuqIiiAKjo6AjAWxYGFQbNgHZBBQ1sGCDZX9gSXMzJ7dPXtzbt6Xm/tueef9OTcAUII5YnEmrARAlihbEunvxYhPSGTgBgEaaAEi0ARGHK5UzAoPDwaIzKx/lff3ADS53racjPXv3/9XUeHxpVwAoCSEU3hSbhbCbYi+4ool2QCgjiF2g2XZ4km+gzBNghSI8NAkp03zl0lOmWK00pRPdKQ3woYA4MkcjiQNALI1YmfkcNOQOORwhK1FPKEI4bUIu3MFHB7CSF4wNytrySSPIGyK+IsBoNAQZqb8KWbaX+KnyONzOGlynu5rSvA+Qqk4k7P8/zya/y1ZmbKZHMaIkgWSgEhkpSPndz9jSZCcRSmhYTMs5E35T7FAFhAzw1ypd+IM8zg+QfK9maHBM5wq9GPL42Szo2eYL/WNmmHJkkh5rlSJN2uGOZLZvLKMGLldwGfL4+cJouNmOEcYGzrD0oyooFkfb7ldIouU188X+XvN5vWT954l/VO/QrZ8b7YgOkDeO2e2fr6INRtTGi+vjcf38Z31iZH7i7O95LnEmeFyf36mv9wuzYmS781GLufs3nD5GaZzAsNnGPgAXxCMvBggHNgCJ0RtQAQA2fzc7MlmvJeIl0uEaYJsBgt54vgMtohrNZdha21rB8Dk8zt9Jd7en3ouITp+1iYqBcBxEDHmztqSFQA41YlcH51Zm6k9AIohAFzayZVJcqZt6Mk3DPKroAhoQB3oAANgCiyR2hyBK/BEKg4EYSAaJIBFgAsEIAtIwDKwEqwDhaAYbAU7QAXYC/aDWnAUHAfN4DQ4Dy6D6+AmuAsegV4wAF6CUfAejEMQhIMoEBVSh3QhI8gCsoWYkDvkCwVDkVAClAylQSJIBq2E1kPFUAlUAe2D6qCfoFPQeegq1A09gPqgYegN9BlGwWSYBmvDxvA8mAmz4CA4Gl4Ip8FL4Ty4AN4Ml8PV8BG4CT4PX4fvwr3wS3gMBVAkFB2lh7JEMVHeqDBUIioVJUGtRhWhylDVqAZUK6oDdRvVixpBfUJj0VQ0A22JdkUHoGPQXPRS9Gr0JnQFuhbdhL6Ivo3uQ4+iv2EoGC2MBcYFw8bEY9IwyzCFmDJMDeYk5hLmLmYA8x6LxdKxJlgnbAA2AZuOXYHdhN2NbcS2Ybux/dgxHA6njrPAueHCcBxcNq4Qtwt3BHcOdws3gPuIJ+F18bZ4P3wiXoTPx5fhD+PP4m/hB/HjBCWCEcGFEEbgEZYTthAOEFoJNwgDhHGiMtGE6EaMJqYT1xHLiQ3ES8THxLckEkmf5EyKIAlJa0nlpGOkK6Q+0ieyCtmc7E1OIsvIm8mHyG3kB+S3FArFmOJJSaRkUzZT6igXKE8pHxWoClYKbAWewhqFSoUmhVsKrxQJikaKLMVFinmKZYonFG8ojigRlIyVvJU4SquVKpVOKfUojSlTlW2Uw5SzlDcpH1a+qjykglMxVvFV4akUqOxXuaDST0VRDajeVC51PfUA9RJ1gIalmdDYtHRaMe0orYs2qqqiaq8aq5qrWql6RrWXjqIb09n0TPoW+nH6PfrnOdpzWHP4czbOaZhza84HNU01TzW+WpFao9pdtc/qDHVf9Qz1berN6k800BrmGhEayzT2aFzSGNGkabpqcjWLNI9rPtSCtcy1IrVWaO3X6tQa09bR9tcWa+/SvqA9okPX8dRJ1ynVOaszrEvVddcV6pbqntN9wVBlsBiZjHLGRcaonpZegJ5Mb59el964vol+jH6+fqP+EwOiAdMg1aDUoN1g1FDXMMRwpWG94UMjghHTSGC006jD6IOxiXGc8QbjZuMhEzUTtkmeSb3JY1OKqYfpUtNq0ztmWDOmWYbZbrOb5rC5g7nAvNL8hgVs4WghtNht0T0XM9d5rmhu9dweS7IlyzLHst6yz4puFWyVb9Vs9Wqe4bzEedvmdcz7Zu1gnWl9wPqRjYpNoE2+TavNG1tzW65tpe0dO4qdn90auxa71/YW9nz7Pfb3HagOIQ4bHNodvjo6OUocGxyHnQydkp2qnHqYNGY4cxPzijPG2ct5jfNp508uji7ZLsdd/nC1dM1wPew6NN9kPn/+gfn9bvpuHLd9br3uDPdk9x/dez30PDge1R7PPA08eZ41noMsM1Y66wjrlZe1l8TrpNcHbxfvVd5tPigff58iny5fFd8Y3wrfp376fml+9X6j/g7+K/zbAjABQQHbAnrY2mwuu449GugUuCrwYhA5KCqoIuhZsHmwJLg1BA4JDNke8jjUKFQU2hwGwthh28OehJuELw3/JQIbER5RGfE80iZyZWRHFDVqcdThqPfRXtFboh/FmMbIYtpjFWOTYutiP8T5xJXE9cbPi18Vfz1BI0GY0JKIS4xNrEkcW+C7YMeCgSSHpMKkewtNFuYuvLpIY1HmojOLFRdzFp9IxiTHJR9O/sIJ41RzxlLYKVUpo1xv7k7uS54nr5Q3zHfjl/AHU91SS1KH0tzStqcNCzwEZYIRobewQvg6PSB9b/qHjLCMQxkTmXGZjVn4rOSsUyIVUYbo4hKdJblLusUW4kJx71KXpTuWjkqCJDVSSLpQ2pJNQwalTpmp7DtZX457TmXOx2Wxy07kKueKcjuXmy/fuHwwzy/v4Ar0Cu6K9pV6K9et7FvFWrVvNbQ6ZXX7GoM1BWsG1vqvrV1HXJex7td86/yS/Hfr49a3FmgXrC3o/87/u/pChUJJYc8G1w17v0d/L/y+a6Pdxl0bvxXxiq4VWxeXFX/ZxN107QebH8p/mNicurlri+OWPVuxW0Vb723z2FZbolySV9K/PWR7UymjtKj03Y7FO66W2Zft3UncKdvZWx5c3rLLcNfWXV8qBBV3K70qG6u0qjZWfdjN231rj+eehr3ae4v3fv5R+OP9ff77mqqNq8v2Y/fn7H9+IPZAx0HmwboajZrimq+HRId6ayNrL9Y51dUd1jq8pR6ul9UPH0k6cvOoz9GWBsuGfY30xuJj4Jjs2Iufkn+6dzzoePsJ5omGn41+rjpJPVnUBDUtbxptFjT3tiS0dJ8KPNXe6tp68herXw6d1jtdeUb1zJazxLMFZyfO5Z0baxO3jZxPO9/fvrj90YX4C3cuRlzsuhR06cplv8sXOlgd5664XTl91eXqqWvMa83XHa83dTp0nvzV4deTXY5dTTecbrTcdL7Z2j2/++wtj1vnb/vcvnyHfef63dC73fdi7t3vSerpvc+7P/Qg88HrhzkPxx+tfYx5XPRE6UnZU62n1b+Z/dbY69h7ps+nr/NZ1LNH/dz+l79Lf/8yUPCc8rxsUHewbsh26PSw3/DNFwteDLwUvxwfKfyH8j+qXpm++vkPzz86R+NHB15LXk+82fRW/e2hd/bv2sfCx56+z3o//qHoo/rH2k/MTx2f4z4Pji/7gvtS/tXsa+u3oG+PJ7ImJsQcCWdqFEAhCqemAvDmEDIfJwBAvQkAccH0fD0l0PR/gikC/4mnZ/ApcQSg1hOAaEQnx8eDiJogqoB8Dp+2w3Z2cv2XSFPtbKdjkZqR0aRsYuItMj/izAD42jMxMd48MfG1Bin2IQBt76fn+klROgLAawOWdVDwY7xNLvibTM/8f+rx7yuYrMAe/H39J270GBs95xzeAAABUFBMVEX////8/Pz49/fk4+P39vb39/fd3Nzs6+vm5ubv7+/m5eXr6+v39vft7Ozx8fH7+/vy8PDRyMzn4+T5+fjl5OT29/bq6urSzsvc39j+//7+/v7Y48/x9O7t8OrDx7nm5OLP4MGvxJ309PPo5+fk5OT29va3zKWZtYHc3NzY2Njm5eaguYu+06zX19fS2c2hvYnL1sLV1tXW1tbY4dC7zqvf6NbS0dHm6ePZ3NXw7+/7+vrW2dLe4dvz9PLX2tPm5+Tv7u7z8/Ps7Ozv7+709PTa2drq6en29fXr6ur19fXx8fDS0tL4+PjZ2dn4+Pfl5eX5+fnY19fJycnu7e3Y19j3+Pfx8PC/vr7o5OXm4ePp6enY1tfX1tbSzM7U0tPV0NLKx8i3r7HAvr/29/X9/f3u7O308/Pq5ujUzM/p6ejZ19fi4eHg39/f3t7v7u/y8vKg2M5xAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAARNJREFUGBmtwdVWAmEUgNHPgWOBjInd/ip2d6GYDHaL3f3+d8p4LlwuZ5YX7s3fZVn8TSCIS7JzArl5eMsXVIgfwhbfFAgqgstGFRYVAyWo0jJUFFd5RSVV1TVQW1cPNDQ24Wq2UC1kmNa29lhHZ1esu6e3r3+ge3BomC9hVIiMkdGxcSYmp2B6ZnYO4vMLCVyCivBJFuNLy9grAnZ0FVhbMXwRVJRPSTyFUS2Ak8KToKJAEm/rqAg4MbwJKgQj+AiiNtjcwkcYlSKJH0Ft7+ziZw+1f4AvwXV4dDyAr5P0afrsPH1xeWXEmKCI5TiOJWKMiFyLiDEmQcbNLc5d1f3DbRa/iz/iSjzZT8/2y+vbO//gA9o7IURWu+bMAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNzEyNcS2bAAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AOTc0nQKifQAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"gang2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=428 428w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=856 856w,\nhttps://images.ctfassets.net/tushy4jlcik7/1pcbNLSZKN9zhTD4OeZrZf/f278c96da874a022b6cab85d4bac046a/gang2.png?w=1712 1712w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위의 그림은 gang 스케줄링을 적용했을 때 모습입니다.<br>\n한번에 필요한 리소스를 확보하여 대기 시간을 최소화합니다.</p>\n<ul>\n<li>driver 리소스 요청 → placeholder 리소스 요청 → 노드 3대 생성</li>\n<li>driver, executor pod 즉시 할당</li>\n</ul>\n<p>여기에서 placeholder pod은 아무 동작도 안하지만 미리 리소스를 확보하기 위해 존재하는 dummy pod 입니다. 만약 리소스를 확보하지 못하는 상황이라면 앱은 대기합니다.\n<strong>Gang Scheduling은 FIFO 큐와 함께 실행하여 리소스 경쟁으로 인한 교착상태에 빠지지 않도록</strong> 할 수 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 47.13541666666667%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAMAAADVnb8xAAABhlBMVEX////r6+vo6Ojt7e3q6urq6+r8/Pvk5OTl5uXl5eXq6+zw8PDf39/6+vr+8fH79/f6+vv4+Pjt9+vy+fDp6ejm5ub7+/v95uf9/v79/f3+/v7g8dz5+fn95ebw+O/83d/f8dvz+vLd8Nn+9/fi8t/u9+z95OX2+/Xa7tbm9OPr9uj//v75/PjX7dP83d7y+fH97O3+9vf7/fvV7ND+8PHs9+rf8Nvm5eb94+T9/v3U7M/+//708/Px8vLw+O7h8d3e3d7h4uH4+Pn9/vz5+Pjd3d7n6Of94uPW7dH7/fr19PPs7e7+8vL96+z3/Pb8/Pz+8/T+7u/Y7dP4/Pf83N36/fnb79f1+/T//f383t/8/vze8Nr83+D9+/rv+O7829z58fHj3czs9ur45+fW3MLs7Ovo49np9ebq6uno6OnY2NfIysn18/Df4M/3+/X8+/vn5+fs7Ozp6enMzc3Ozs38+vj19fX39/fh4uL29/f29vb09PTz8/Pd3d3r6+r6+vn6+fn4+fnObqQVAAAACXBIWXMAAC4jAAAuIwF4pT92AAAAB3RJTUUH6AEUCC0zRTGwdgAAATlJREFUGBkFwYdDzAEYANBXjiKf6Gh+P1cZlVWccS5kJjsjIzsjFGWPC/nPvQcAAAAAAEBT85rSWgBgXUtraf0GANo2BpvaN8eWgI4ytm7rhK7unl7oKwNJAbC9D0ioAP1lQFAABgYBgR0F2LkLINkNDA0DJCpgZA+AtLcA+/YDSByA0RGAEMYOwqEqoKdTcHgMR44COCbV4Hh9HHDipKSCUxMAnD5zVg3j9XMA5y9MJhcZGARAi1DD1CUAl69IV6+5PgwAN+T0TW7dBgDhjpkpAEDWuHsPAMj7D2arAABZeDgKAMhHj+u9AABRTDwBAIin1VkAAM+ezwEAePFyBgDAq9fzgDdvJ98tLELT+w/A0vLHT5+/fAW+RWbG9x8/IzN/NYNGRmau/G5kZP5ZAYC/pQYAgNW2f4D/03wrmg3mPPoAAAARdEVYdGV4aWY6Q29sb3JTcGFjZQAxD5sCSQAAABN0RVh0ZXhpZjpFeGlmT2Zmc2V0ADEwMnNCKacAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADE5MjD6eamJAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA5MDWlRAQsAAAAGHRFWHRleGlmOlNvZnR3YXJlAFBob3RvU2NhcGV02ZskAAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"kubemarkk\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=960 960w,\nhttps://images.ctfassets.net/tushy4jlcik7/3DRNtnh2w1JZeU17o2IiLR/834aae6213df1e8c56a9341b8f4edce4/kubemarkk.png?w=1920 1920w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>또한 동시 실행 Pod가 많을 수록 스케줄링 성능 향상을 기대할 수 있습니다. 위 그림은 Yunikorn에서 kubemark를 통해 벤치마크한 결과입니다. 회사 환경에서 spark 작업 시간을 기준으로 테스트했을 때도 성능 향상을 확인할 수 있었습니다.</p>\n<p>다음 글에서는 Spark 3.4 버전에서 공식적으로 지원하는 Volcano, Yunikorn에 대해 이어서 정리해보겠습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/\">https://blog.cloudera.com/spark-on-kubernetes-gang-scheduling-with-yunikorn/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"8d6b9e00-f4f6-5624-b75c-fabb15be093f","title":"Spark on Kubernetes: 커스텀 스케줄러 (2)","slug":"spark-on-kubernetes-scheduler-2","publishDate":"December 10, 2023","publishDateISO":"2023-12-10","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA 되었습니다 👏🏻<br>\n오늘은 <a href=\"https://swalloow.github.io/spark-on-kubernetes-scheduler/\">지난 글</a>에 이어 가장 많이 사용하는 Volcano, Yunikorn 스케줄러에 대해 알아보겠습니다.</p>\n<br>\n<p>3.4 버전 기준으로 Spark에서는 Volcano, Yunikorn 두 가지 커스텀 스케줄러를 공식적으로 지원합니다. 두 가지 오픈소스 모두 네이티브 환경에서 배치 처리를 지원하기 위한 프로젝트이며 최신 버전 기준으로 모두 유사한 기능을 지원하고 있습니다. 먼저 Volcano 부터 살펴보겠습니다.</p>\n<br>\n<h2 id=\"volcano\" style=\"position:relative;\"><a href=\"#volcano\" aria-label=\"volcano permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano</h2>\n<p>초기의 Volcano는 <a href=\"https://github.com/kubernetes-retired/kube-batch\">kube-batch</a> 프로젝트 기반으로 구성되었으나 <strong>1.8 버전부터 쿠버네티스 스케줄러 플러그인 방식을 지원</strong>하게 되었습니다. 스케줄러 플러그인 기반으로 구성한 커스텀 스케줄러는 기본 스케줄러와 호환 가능하며 버전 업데이트 영향도 적게 받는 장점이 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 54.88798370672098%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAWCAIAAAA97EnnAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAQnSURBVEjHxZaLT1NXHMf9dzZY4gPdgnGGZQzBRXxkmcmSJctW60oFJd2koEYgnZsYQSMgVTRCEIzdUKOQSZFHWwqFPujL0vs4txXaUsTaltLXvdf9LiXlWvEBwezkk5vfOf31fs/j+7v3bnr1P7VNa8qmaTr5vsYwzAYLsyxL8RrSq5BuAOnVyKjlj/t8vo8jjDmQ3YTMY8isQ7onaGKY07YZkNWAHNYNFk4ySXfIY5vD1FM6k8PACdvNyDKBjCPIMo5Mo8ikJceUlNOeEmZikeBId1CzOmH9vx8k/DIWajUr6gdb64da6wevX1Lf7DI/pBCJncglJLvx8p3Eb7vxy2L+VkfJSeeRT5cRfIIJs1OBU5jFdUWbl4Vhdp5G8duYUyt6iKHGsfbL2ltAy3hn31MVJ1yRT54tJqr2EFWFeLPkDeEst+w7jnPfU6eLuODPw4CrunhFeLbtDF62g5R8SZTnEse/IMp3kie/giuAi7f5b9dyfmaZYCw8hdnI3nayp22Z3jbKYUXavpWRoQcgHJ/B4IZ46TJY6fZ0DCDp1zzhYzkghqoKSMku8mQe+Xsekuajyny8dHtKOGUucvAedWavq/YAdboQ1gEBeV9OyA67avZTZ/ehU3uIym8yzAX+CCciq5srNN7ju1GRhpQf53dTXkgJI5uJuF5JyCs4rkkBZNBw2qkRoLOOLxyj40mWXoOro3ScXu0Pi4uLkdfbXPB5xkg8HodMhmWidIx9xa65nGCLYL7v9XycTrw5mGCScSax/jqG+cLScW9kYDKUxm7CAiZVmumJx/zupIl6pPcpjYFU8kKUeZfw7MukrNNTe3sG+KPL8yL82iaLGvGsI5Y0E4IdXEUugZVsBUNhJVvSI48FBfzkeyOBdwmrrOHPy+wHarCDtViO2DY6FYzRifTxiK5Q/Hs9FWRDjUE5cvauLoYyXYqLYAZQAhrBrnRmttDSrZl/2zFzwrEEqzQG+wwc/aZgguZS4ZDgjIFfLjlhNvtPEYVSJ9yuSSBSHt3L8SvwrVJYuNQt6hftg/icoKKgWisbUDSMdV7RdzQaOpoMHS2mO+3W+9gLKlOYDgfmH12df9jM0dPCLIZSBoF1Az81OIqk2B1loOaGL/eEHbS3ldg2i6xAenGfHV2JD14YBj0AnrIX+uQXn1xLdfU+W6bwgmUYjgeeG7BdEAQdo+BVhl3Z6jyJQ9rsFdc/27Ikdv6ut/LmM3mvv6ZjRtblqbvrrVN4G7p9P/xFwK85ZcZDF4d+vNr/c2vfLZ1WO2Mc91psz7FQfCFTmIkuBNV/B1UKDs0/bDzKzzjW5OLWJOTOjH/YH8IDbWD9r8XZQEKPRdaBAY+Aezbm0wc+a0iS9Hg8fr/f7Xa7XK7p6Wmv1/vRv7k40yUS0WgUrrFYDJ6OEEOwDuH/AJLQpzuftfKCAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxOTY0mXiolAAAABl0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMTA3OD//NZkAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volcano\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=491 491w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=982 982w,\nhttps://images.ctfassets.net/tushy4jlcik7/7jjm2qa7Lu5G5GAtss5ml1/69ea6bbad178093fc0a17036d7799994/volcano.png?w=1964 1964w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Volcano의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler</strong>: 여러 스케줄링 알고리즘을 거쳐 가장 적합한 노드에 작업을 할당합니다.</li>\n<li><strong>ControllerManager</strong>: CRD (Queue, PodGroup, VCJob)의 lifecycle을 관리합니다.</li>\n<li><strong>Admission</strong>: CRD API에 대한 유효성 검사를 담당합니다.</li>\n</ul>\n<p>PodGroup을 통해 그룹 단위의 스케줄링이 가능하며, 하나의 Queue에는 여러 개의 PodGroup이 할당될 수 있습니다. 각 PodGroup은 status를 가지고 있어 Pending, Running 등의 상태가 관리됩니다.</p>\n<br>\n<p>스케줄링이 실행되는 워크플로우는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.46878198567042%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAIAAABtIdhUAAAMN2lDQ1BpY2MAAEiJlVcHWFPJFp5bUiG0ANIJvQkiNYCUEFoA6UWwEZIAocQYCCp2ZFHBtaBiARu6KqLYAbEjdhbF3hdUVJR1sWBX3qSArvvK9+b75s5//znznzPnztx7BwD1E1yxOBfVACBPVCCJCw1kjElJZZCeAjIwBBrADFhzefliVkxMJIBlsP17eXcDILL2qqNM65/9/7Vo8gX5PACQGIjT+fm8PIgPAIBX88SSAgCIMt5iSoFYhmEF2hIYIMQLZDhTgatlOF2B98htEuLYELcCQFblciWZAKhdhjyjkJcJNdT6IHYW8YUiANQZEPvl5U3iQ5wGsS20EUMs02em/6CT+TfN9CFNLjdzCCvmIi/kIGG+OJc77f9Mx/8uebnSQR/WsKpmScLiZHOGebuVMylChlUh7hWlR0VDrAXxByFfbg8xSs2ShiUq7FEjXj4b5gzoQuzM5wZFQGwEcYgoNypSyadnCEM4EMMVgk4VFnASINaDeIEgPzheabNRMilO6QttyJCwWUr+HFci9yvz9UCak8hS6r/OEnCU+phaUVZCMsRUiC0LhUlREKtB7JSfEx+htBlVlMWOGrSRSONk8VtCHCcQhQYq9LHCDElInNK+LC9/cL7YxiwhJ0qJ9xVkJYQp8oO18rjy+OFcsMsCEStxUEeQPyZycC58QVCwYu7YM4EoMV6p80FcEBinGItTxbkxSnvcXJAbKuPNIXbLL4xXjsWTCuCCVOjjGeKCmARFnHhRNjc8RhEPvhREAjYIAgwghTUdTALZQNje29gL7xQ9IYALJCATCICjkhkckSzvEcFrPCgCf0IkAPlD4wLlvQJQCPmvQ6zi6ggy5L2F8hE54AnEeSAC5MJ7qXyUaMhbEngMGeE/vHNh5cF4c2GV9f97fpD9zrAgE6lkpIMeGeqDlsRgYhAxjBhCtMMNcD/cB4+E1wBYXXAm7jU4j+/2hCeEDsJDwnVCJ+H2RGGx5KcoR4NOqB+izEX6j7nAraGmOx6I+0J1qIzr4gbAEXeDfli4P/TsDlm2Mm5ZVhg/af9tBj88DaUdxZmCUoZRAii2P49Us1dzH1KR5frH/ChiTR/KN3uo52f/7B+yz4dtxM+W2AJsP3YWO4mdx45gjYCBHceasDbsqAwPra7H8tU16C1OHk8O1BH+w9/gk5VlMt+5zrnH+Yuir0AwVfaOBuxJ4mkSYWZWAYMFvwgCBkfEcxrOcHF2cQVA9n1RvL7exMq/G4hu23du3h8A+B4fGBg4/J0LPw7AXk+4/Q9952yZ8NOhAsC5QzyppFDB4bILAb4l1OFO0wcmwALYwvm4AA/gAwJAMAgH0SABpIAJMPosuM4lYAqYAeaCUlAOloKVYC3YADaD7WAX2AcawRFwEpwBF8FlcB3chaunG7wAfeAd+IwgCAmhIXREHzFFrBAHxAVhIn5IMBKJxCEpSBqSiYgQKTIDmYeUIxXIWmQTUovsRQ4hJ5HzSAdyG+lCepDXyCcUQ1VRbdQYtUZHoEyUhUagCeh4NBOdjBahJehidDVag+5EG9CT6EX0OtqJvkD7MYCpYLqYGeaIMTE2Fo2lYhmYBJuFlWGVWA1WjzXD53wV68R6sY84EafjDNwRruAwPBHn4ZPxWfgifC2+HW/AW/GreBfeh38j0AhGBAeCN4FDGEPIJEwhlBIqCVsJBwmn4V7qJrwjEom6RBuiJ9yLKcRs4nTiIuI64m7iCWIH8RGxn0Qi6ZMcSL6kaBKXVEAqJa0h7SQdJ10hdZM+kFXIpmQXcgg5lSwiF5MryTvIx8hXyE/JnykaFCuKNyWawqdMoyyhbKE0Uy5RuimfqZpUG6ovNYGaTZ1LXU2tp56m3qO+UVFRMVfxUolVEarMUVmtskflnEqXykdVLVV7VbbqOFWp6mLVbaonVG+rvqHRaNa0AFoqrYC2mFZLO0V7QPugRldzUuOo8dVmq1WpNahdUXupTlG3UmepT1AvUq9U369+Sb1Xg6JhrcHW4GrM0qjSOKRxU6Nfk645UjNaM09zkeYOzfOaz7RIWtZawVp8rRKtzVqntB7RMboFnU3n0efRt9BP07u1ido22hztbO1y7V3a7dp9Olo6bjpJOlN1qnSO6nTqYrrWuhzdXN0luvt0b+h+GmY8jDVMMGzhsPphV4a91zPUC9AT6JXp7da7rvdJn6EfrJ+jv0y/Uf++AW5gbxBrMMVgvcFpg15DbUMfQ55hmeE+wztGqJG9UZzRdKPNRm1G/cYmxqHGYuM1xqeMe010TQJMsk1WmBwz6TGlm/qZCk1XmB43fc7QYbAYuYzVjFZGn5mRWZiZ1GyTWbvZZ3Mb80TzYvPd5vctqBZMiwyLFRYtFn2WppajLWdY1lnesaJYMa2yrFZZnbV6b21jnWw937rR+pmNng3HpsimzuaeLc3W33aybY3tNTuiHdMux26d3WV71N7dPsu+yv6SA+rg4SB0WOfQMZww3Gu4aHjN8JuOqo4sx0LHOscuJ12nSKdip0anlyMsR6SOWDbi7Ihvzu7Ouc5bnO+O1BoZPrJ4ZPPI1y72LjyXKpdrrjTXENfZrk2ur9wc3ARu691uudPdR7vPd29x/+rh6SHxqPfo8bT0TPOs9rzJ1GbGMBcxz3kRvAK9Znsd8fro7eFd4L3P+y8fR58cnx0+z0bZjBKM2jLqka+5L9d3k2+nH8MvzW+jX6e/mT/Xv8b/YYBFAD9ga8BTlh0rm7WT9TLQOVASeDDwPdubPZN9IggLCg0qC2oP1gpODF4b/CDEPCQzpC6kL9Q9dHroiTBCWETYsrCbHGMOj1PL6Qv3DJ8Z3hqhGhEfsTbiYaR9pCSyeTQ6Onz08tH3oqyiRFGN0SCaE708+n6MTczkmMOxxNiY2KrYJ3Ej42bEnY2nx0+M3xH/LiEwYUnC3UTbRGliS5J60rik2qT3yUHJFcmdY0aMmTnmYopBijClKZWUmpS6NbV/bPDYlWO7x7mPKx13Y7zN+Knjz08wmJA74ehE9YncifvTCGnJaTvSvnCjuTXc/nROenV6H4/NW8V7wQ/gr+D3CHwFFYKnGb4ZFRnPMn0zl2f2ZPlnVWb1CtnCtcJX2WHZG7Lf50TnbMsZyE3O3Z1HzkvLOyTSEuWIWieZTJo6qUPsIC4Vd072nrxycp8kQrI1H8kfn99UoA1/5NukttJfpF2FfoVVhR+mJE3ZP1Vzqmhq2zT7aQunPS0KKfptOj6dN71lhtmMuTO6ZrJmbpqFzEqf1TLbYnbJ7O45oXO2z6XOzZn7e7FzcUXx23nJ85pLjEvmlDz6JfSXulK1Uknpzfk+8zcswBcIF7QvdF24ZuG3Mn7ZhXLn8sryL4t4iy78OvLX1b8OLM5Y3L7EY8n6pcSloqU3lvkv216hWVFU8Wj56OUNKxgryla8XTlx5flKt8oNq6irpKs6V0eublpjuWbpmi9rs9Zerwqs2l1tVL2w+v06/ror6wPW128w3lC+4dNG4cZbm0I3NdRY11RuJm4u3PxkS9KWs78xf6vdarC1fOvXbaJtndvjtrfWetbW7jDasaQOrZPW9ewct/PyrqBdTfWO9Zt26+4u3wP2SPc835u298a+iH0t+5n76w9YHag+SD9Y1oA0TGvoa8xq7GxKaeo4FH6opdmn+eBhp8PbjpgdqTqqc3TJMeqxkmMDx4uO958Qn+g9mXnyUcvElrunxpy61hrb2n464vS5MyFnTp1lnT1+zvfckfPe5w9dYF5ovOhxsaHNve3g7+6/H2z3aG+45Hmp6bLX5eaOUR3HrvhfOXk16OqZa5xrF69HXe+4kXjj1s1xNztv8W89u517+9Wdwjuf7865R7hXdl/jfuUDowc1f9j9sbvTo/NoV1BX28P4h3cf8R69eJz/+Et3yRPak8qnpk9rn7k8O9IT0nP5+djn3S/ELz73lv6p+Wf1S9uXB/4K+Kutb0xf9yvJq4HXi97ov9n21u1tS39M/4N3ee8+vy/7oP9h+0fmx7Ofkj89/TzlC+nL6q92X5u/RXy7N5A3MCDmSrjyXwEMVjQjA4DX2wCgpQBAh+cz6ljF+U9eEMWZVY7Af8KKM6K8eABQD//fY3vh381NAPZsgccvqK8+DoAYGgAJXgB1dR2qg2c1+blSVojwHLAx+mt6Xjr4N0Vx5vwh7p9bIFN1Az+3/wLl/HyDJEPosgAAAAlwSFlzAAAWJQAAFiUBSVIk8AAAAAd0SU1FB+gBFAgtM0UxsHYAAAS7SURBVEjHxZb7T5pnFMf7Ry3Zki3pmq5Zt/G+yNChxirtXLt0OpJqOy9Z6mVa7bS0tVoVxPu1U9QpKopCnaWaalGhIkW5iSA3ud/f1x14O3yLLqs/7eSEPDy8eT/nnOf7nMO5o//JzuH4kcODeQN4wt0+3Ol0GgyGJZJJpVL32Q3eYyKZw+Eg9mNgDD/yh3ByLD5gu90SiQRBkNzcXBaLxWAwaDTayah9LqNVt0J22CE/4PF4bDabTqdVqVQm0z58JTbfgfkv56uePWSPt9SNPoWFymgkwPnMi/lXL17PugQRADgYwYJhTCia54//qdEZYP1ipkHw+NM5LkXUhoq46AT747WFJtgH9wYj8OlwugWrooZJ3hMBjyPsTQaX9Td8VPDl5fLMLHbe+VLaS6WCADdXUtvvf3f/l68JMJFEOBwOhUKRSATWh3ajzbBq1b+amONMzXPBxatTMo0CfgqEowSjX8K/1Xa3gFdeOcgminwM9gSiQtnyiFQwtjLT95zvDWBwGACmUGkXfkTod7LRWxlfZVOT6hyKYHj8iCLRyKW7jJxHrB8aC7PYP11h5yXAfr9fq9Xq9Xqj0bi3t5cMhjNWm4xLW5sKvUquVzpcwfX1dbFYTEFTUq8VMK4XoyiayNhms+p0OlhA5YkdDMd6xCMDi6P9z/ng4ysz5IzFr5d6Zp4Nivi900PJpQawXOfKrF+WyG2wZXX4QMNCoRBB0ExWbc5vY/S0dAC7AxGA7Wh0sg35m22V2x/7Cu4LhpmPWCU998oG6gvby293VMBLiIfhjLmzvTdbim+2FJV030sG75rNW4a3kO4bw1tY2F2x+kCpURSJOYIQZ0wUFlRqNpvhjI8zxjD2OKdJ0N401QHeIRokDoJgdM4PwRHcaLp9t//3ZHBxdz2Ii1rNBP/kzjdynZYQl6DhgoiLdFZ/QYA9gZhQ1RrtpmJrVbauMZgIAftD4ZKemscT3KfTnfWjzeAJsM/n21Irlzdfgcu2NuBavweela0NLI798WJi+vXCsHTSfOgmwBRa6uUchH4jnXKNTslISRJXIuMoFmVxfi3tqakcYhd1VVUMPiBnbLEc7O7ugiz0el1yxofeaLd4uGGyrXGqo2WmK9FAQFyUHDr9+wwk+1uU8a9gEFejIFZh0FfbbF+vZJgMnl5bgEqAdy2cEJfLF5Uq7XV8lcUVIncuCkpNL+m+UvcXPe2UzhXFcLhQxHX6rAhNqWZmP/wZqcpOrc0lwiLEBbUsaC8r7KioHXlyiqq9gejChtXifAeG34iWmUKjp2bkoCj11JapVy1uimo35mq6OMx+3tU+HnNewtveU5NbJlQiv7U0r7U0WVygVaf3vSHhCcSGhEajmSOZSCQ6OQNWRY38B+enOWlTrango+zPZeJm8gN2u32fZBaLBTahO8XAiejcbtfBwQG0cqvVCr0Grk18ouyfOtRwHNdodnd21NCPYAEvBQVBeyJa6fEU8XlhQljjBiqDdns8FhMrCESp3FKr1R84ULe3lUAym03A3t83yuVyhUKeBIb44EZF/jEcx08Bf4i5XC593KA28RuiN8QNwoWjCQQCZ/gjcCYwhBwMBkNxgwWQwnGDbOCTnNB/2t/D4objrcf5XwAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTk1NLJV+1cAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADkwONv1eJEAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"volscheduler\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=489 489w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=977 977w,\nhttps://images.ctfassets.net/tushy4jlcik7/46reiOAVOHfNru6XrAmo2V/2908ca18f83a8c4e0ebf208716777ad3/volscheduler.png?w=1954 1954w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>client가 제출한 작업을 watch하고 캐싱합니다.</li>\n<li>session을 새로 생성하고 스케줄링 사이클을 시작합니다.</li>\n<li>캐시에 예약되지 않은 작업은 session의 대기열로 보냅니다.</li>\n<li>필요한 작업을 순회하면서 순서대로 스케줄링 단계를 실행하고 적합한 노드를 찾습니다.</li>\n<li>작업을 노드에 바인딩합니다.</li>\n<li>세션을 종료합니다.</li>\n</ul>\n<br>\n<p><strong>Volcano 적용 과정</strong><br>\nVolcano 적용을 위해 필요한 단계는 다음과 같습니다.</p>\n<ol>\n<li>Volcano 환경 및 리소스 배포</li>\n<li>Spark Volcano 이미지 빌드 및 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># Specify volcano scheduler and PodGroup template\n--conf spark.kubernetes.scheduler.name=volcano\n--conf spark.kubernetes.scheduler.volcano.podGroupTemplateFile=/path/to/podgroup-template.yaml\n# Specify driver/executor VolcanoFeatureStep\n--conf spark.kubernetes.driver.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep\n--conf spark.kubernetes.executor.pod.featureSteps=org.apache.spark.deploy.k8s.features.VolcanoFeatureStep</code></pre></div>\n<p><br><br></p>\n<h2 id=\"apache-yunikorn\" style=\"position:relative;\"><a href=\"#apache-yunikorn\" aria-label=\"apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Apache Yunikorn</h2>\n<p>Yunikorn은 Volcano보다 뒤늦게 시작된 Apache 프로젝트입니다.\n컨테이너 오케스트레이션을 위한 경량의 범용 스케줄러를 지향하고 있으며 대부분의 스케줄링 알고리즘도 지원하고 있습니다.\n또한 Volcano와 동일하게 스케줄러 플러그인 방식을 지원합니다. 추가로 Yunikorn은 조직 단위로 리소스 관리가 가능하도록 <strong>계층 구조의 큐를 지원</strong>합니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 60.01517450682853%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAYCAMAAAC/Wk/yAAABOGlDQ1BpY2MAACiRY2Bg4kksKMhhYWBgyM0rKQpyd1KIiIxSYH/CwMwgzMDBoMhgnphcXOAYEOADVMIAo1HBt2sMjCD6si7IrMjczQymWV3a75LzMnfN8r2AqR4FcKWkFicD6T9AnJBcUFTCwMAYA2Qrl5cUgNgNQLZIEdBRQPYUEDsdwl4BYidB2HvAakKCnIFskH0CyRmJKUD2AyBbJwlJPB2JDbUXBNh8I4zMLQk4lFRQklpRAqKd8wsqizLTM0oUHIGhk6rgmZesp6NgZGBkwMAACmuI6s83wGHIKMaBEMupZGCwWMLAwDQdIZb0kIFh6zYGBv4ohJh6DQOD4DIGhoM2BYlFiXAHMH5jKU4zNoKwubczMLBO+///czgDA7smA8Pf6////97+//9foD7mWwwMB74BADY8XhKuG0IEAAACQ1BMVEX////k7+/D4uPo8fE4w8gSzdRHxsv9/f3z9/wswsgSxcsTwcgTvMITwMYTwsgTwMcSyM47xcvX4OuPv/Gw1fwSytETvsUSwsgSxMoSyM/O3eyQwPG72/xFw8hUxsv+/v78/f3t7e3b3Nzv7+/g4OD4+Pjm5ubFxcXExMTKysrNzc3GxsbCwsLDw8PLy8vHx8fp6eng4N/w8PDx8fHr6+rf39/19fX8/Pzr6+u/v7/q6ur5+fn6+vrZ2dnW1tbU1NTn5+f1+P61yvbv9P3h8PCe2tzQ6erc3Nz29vbe3t7z8/O7z/arw/SuxvWT2NoSx84TsrgTrrQTtLoSw8piyczu7u77+/vd3d3o6Ojm6OugtuLi5u3m5eWU2NoUq7BoztH09PTy8vLj4+PR0NDNzMzj4uLS0tLk5OTs8/O73+G63+C63+Hh7+/i4uLl5eXh4eHs7Oz39/fb29vX19fQ0NDV1dXS1Ne8v8Ts7e7U1tm9wMTp6uvo6evIys66vsLq6+zv7/Dj5OX3+Pjk5eeHjZRWXmjQ0tWOk5pYYGrJzM+IjpXIys1tdHxSW2X5+fr6+/tUWmNxeYPMz9JBSFKqr7aYnKI/SFTg4uRhZ3Bja3alqrB1f4vc3uCqr7R1gIvX2dulq7F0f4rW2NqLlJ13gIr4+frMz9PU1trq7O7Ex8zk5ujh5OfBxcrt7/HS1dnN0NT7+/z9/v7f6vPS4e7w9fnh6/TQ4O7u9Pjq8ffY5fHZ5vH3+vzz8/Tz9PTy8/T39/j19fYLR8HaAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAjFJREFUGBl9wYdX00AAB+CfI0ZERdw7xjQFcXA2mp4pQpwc50K0GHeujioINg7APXEr7r33HuAW0T9NquH1+Z7x+xCgU+eMLviPrlJGN7m7jCBZktQju2ev3jl9JCm3b7/+CJIlSQOyBw4anDNEknKHDhuOICOkjJHKKAVB1NEZmhbSESSclz+mYOy48RPyC/NJQeFEBImoaURNMyZNNuGLEvovU+hvFokBRVOLSwAbwLTpM4CZs9Jm449S+GyAlfGYRYs1YM7cecD8BeULKxYtjnO90iRLKHwWIJeGqIWQY1hLly1fYa4cvKqiPGd1zNVUoSTQgQLglERhwVmzdt36guSGjVXV1VWb0E6uKUIHCihhqgIWuJuwaxPhzVbSCacMwLRtZFCAldFaTvNsD9qWRLI0WRMK2dGIYxtQICsAZLSzgNjWEttSwmAuUyPcEJqrRTwBPe6kInHqqMQglgEbgEWJC5nQtMQ2+rftZTSNVMJX5JpcF8wkumAm1014nvBc1yPMdT3huTH4BFBX37Bj5666+t179socBrBvv3zgoHlIaWgAXPh04HDjkaPHjp9oPHnq9BkGHU1nz52/cPHS5StXrzWBwSeA6zdu3rp95+69+w8eVgoIPHr85Omz5y9evnr95i0EfAzvmlvef/j4qbnl85ev3zyYQOv3prYfP9uira2ADp+BNNXRiGMCiMBAO9VKUZKKAzDQgQmdm0zorsmEzqMAZybXOWNc54xx4Bc5CJtYFBy7DQAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADI2UxuiZQAAABl0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AMTMxONIY964AAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADc5MXl1VnYAAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyMAq63rAAAAAVdEVYdGljYzpkZXNjcmlwdGlvbgBNWDI3OWIHo94AAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=330 330w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=659 659w,\nhttps://images.ctfassets.net/tushy4jlcik7/fe5LddmNsJwbIKhu0h4LX/33623a3bbfe6bd346231461938c7b873/yunikorn.png?w=1318 1318w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>Yunikorn의 주요 컴포넌트는 다음과 같습니다.</p>\n<ul>\n<li><strong>Scheduler Interface</strong>: 다른 리소스 플랫폼(K8S, YARN)과 통신을 위한 인터페이스</li>\n<li><strong>Scheduler Core</strong>: 스케줄링 알고리즘 구현, 메트릭 수집, 컨테이너 할당 요청</li>\n<li><strong>Kubernetes Shim</strong>: 쿠버네티스와 통신을 담당, Pod를 특정 노드에 바인딩하는 역할</li>\n<li><strong>Admission Controller</strong>: mutation, validation hook을 담당</li>\n</ul>\n<p>Yunikorn은 Volcano와 달리 추가로 배포되는 CRD가 없습니다.<br>\n큐와 알고리즘 등 관련 설정은 모두 Yunikorn 배포에 포함됩니다.<br>\n간단한 Yunikorn 설정 파일 예시는 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"yaml\"><pre class=\"language-yaml\"><code class=\"language-yaml\"><span class=\"token key atrule\">partitions</span><span class=\"token punctuation\">:</span>\n<span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> default\n  <span class=\"token key atrule\">nodesortpolicy</span><span class=\"token punctuation\">:</span>\n    <span class=\"token key atrule\">type</span><span class=\"token punctuation\">:</span> binpacking\n  <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n    <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> root\n      <span class=\"token key atrule\">submitacl</span><span class=\"token punctuation\">:</span> <span class=\"token string\">'*'</span>\n      <span class=\"token key atrule\">properties</span><span class=\"token punctuation\">:</span>\n        <span class=\"token key atrule\">application.sort.policy</span><span class=\"token punctuation\">:</span> fifo\n        <span class=\"token key atrule\">application.sort.priority</span><span class=\"token punctuation\">:</span> disabled\n      <span class=\"token key atrule\">queues</span><span class=\"token punctuation\">:</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> prod\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 300G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">30</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 600G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">60</span>\n        <span class=\"token punctuation\">-</span> <span class=\"token key atrule\">name</span><span class=\"token punctuation\">:</span> stage\n          <span class=\"token key atrule\">resources</span><span class=\"token punctuation\">:</span>\n            <span class=\"token key atrule\">guaranteed</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 100G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">10</span>\n            <span class=\"token key atrule\">max</span><span class=\"token punctuation\">:</span>\n              <span class=\"token key atrule\">memory</span><span class=\"token punctuation\">:</span> 200G\n              <span class=\"token key atrule\">vcore</span><span class=\"token punctuation\">:</span> <span class=\"token number\">200</span></code></pre></div>\n<p>위와 같이 prod, stage 등 여러 개의 큐를 계층형으로 생성할 수 있습니다.<br>\n스케줄링 정책은 크게 <strong>node sorting 단계와 application sorting 단계</strong>로 나누어집니다.<br>\ngang scheduling을 사용하는 경우, application sorting은 항상 fifo를 사용해야 합니다.</p>\n<p>Yunikorn에서 Gang Scheduling이 실행되는 단계는 다음과 같습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 67.26825266611976%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAbCAMAAAA5zj1cAAAAxlBMVEX////09PTv7+/z8/Px8fHy8vL19fXn5+f6+vri4uL8/Pzm5ub//v757eru7u7w8PD6+vnr5OLc3Nzt7e3+/v77+/v5+fn9/f3s7Ozx7Orw6eff39/+/Pvm5eTr6+v4+Pjy7uz28fDk5OT57enm393j4+Pq6url5eXg4ODp6en19PXh4eHo6Oj14dzt6+rh29nu3try8PDq2dTy7u3V1dX29vbe3t7u6un39/fb29v35uHr5+bx4t7a2tr08/P9+Pfd3d3S0tK3mdbQAAAACXBIWXMAABcRAAAXEQHKJvM/AAAAB3RJTUUH6AEUCC0zRTGwdgAAAchJREFUOMuVUul60zAQ1O0DkEpVyYaABSq+qLlrCDe8/0ux2sapXcIPNvm0mk+j1eysCfmPoBjsgDgicUACkbwBipAsT+vNNUKKW6RIeQ8Z5P4DwpWCv15qIFrqG0Sp/tlDyTk/TwvnUlJ4WRQbZXwNbAnLhfPuAnKVpUu0ZuzRY87FzkihNsQlnjxtfB58o+2z57kPUZeuOkm8fNEypo+wWzZ9r1Qcxq6p4WdBLB1eqlVcmQOxCVBRBh/E1PY1M2zavVrr726tuvM0yV4bY2zRFiNk9ubtmoiNCmvRpd5VED54zB1dfAIdUSQ1aVqoKm3BVZ4QHfhdH48xovmGMUjv3hfa1OFIxDNQhBM679KqbbKAf2jZuiL13htdNxpyuC5BGoXnlXNunjYjNCF4P89z7sqy+viJzrPMpszM+8Cnak200IcdY2+FEOzzl3WRuDN1jpsIXctD09j1oE5O5uu37/1g0vfCtEYfr8jJyfz4mfutPS1+ZtaydF3GzQindMasTUf817iyh08booKmwWFrfJ7733tY9ZhNeh+Cnf6uKDVDjRGIYJZSwHf5UaNOs240Y3XsMevrbdd2Pd1NMz35J9rwiDuB/gBoOiUPjO0SdwAAABF0RVh0ZXhpZjpDb2xvclNwYWNlADEPmwJJAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQAMzituL4jAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMjE5pN2tDwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AODIw5tr4FgAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"yunikorn-gang\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=305 305w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=610 610w,\nhttps://images.ctfassets.net/tushy4jlcik7/5rzxgIdISp0NOs4N4BDifk/eaf08f7d78d3d83880be55951ee0afa0/yunikorn-gang.png?w=1219 1219w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<ul>\n<li>TaskGroup이 정의된 application을 submit 합니다.</li>\n<li>Shim이 application을 생성하고 이를 Core(Kube scheduler)에 전달합니다.</li>\n<li>Shim은 TaskGroup의 각 member에 대한 placeholder pod를 생성합니다. spark의 경우, member는 driver, executor가 될 수 있습니다.</li>\n<li>pod가 정상적으로 생성되고 나면 AllocationAsks로 처리되어 Core에 전달됩니다.</li>\n<li>placeholder는 Core를 통해 적절한 노드에 바인딩됩니다.</li>\n<li>이제 실제 pod가 AllocationAsk로 Core에 전달됩니다.</li>\n<li>실제 pod와 모든 placeholder pod가 스케줄링 완료된 이후 Shim은 실제 pod를 바인딩합니다.</li>\n</ul>\n<br>\n<p><strong>Yunikorn 적용 과정</strong><br>\nYunikorn 적용을 위해 필요한 단계는 다음과 같습니다.<br>\nYunikorn의 경우 annotation 설정을 사용합니다.</p>\n<ol>\n<li>Yunikorn 환경 및 설정 배포</li>\n<li>Spark configuration 전달</li>\n</ol>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">--conf spark.kubernetes.scheduler.name=yunikorn\n--conf spark.kubernetes.driver.label.queue=root.default\n--conf spark.kubernetes.executor.label.queue=root.default\n--conf spark.kubernetes.driver.annotation.yunikorn.apache.org/app-id={{APP_ID}}\n--conf spark.kubernetes.executor.annotation.yunikorn.apache.org/app-id={{APP_ID}}</code></pre></div>\n<p><br><br></p>\n<h2 id=\"volcano-vs-apache-yunikorn\" style=\"position:relative;\"><a href=\"#volcano-vs-apache-yunikorn\" aria-label=\"volcano vs apache yunikorn permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Volcano vs Apache Yunikorn</h2>\n<p>앞서 살펴 본 내용을 통해 각 스케줄러의 장단점을 정리해보면 다음과 같습니다.<br>\n모두 Helm 차트를 지원하므로 쉽게 구성할 수 있습니다.<br></p>\n<p><strong>Volcano</strong><br>\n장점: Kubeflow에 대한 지원<br>\n단점: spark 이미지 빌드, CRD 단위로 관리가 필요</p>\n<br>\n<p><strong>Yunikorn</strong><br>\n장점: 작업 상태를 확인할 수 있는 Web UI 지원<br>\n장점: 경량화되어 있으며 계층 구조의 큐를 지원<br>\n장점: 추가로 필요한 부분이 적어 운영이 편리<br>\n단점: 주요 설정은 모두 있으나 Volcano 대비 적은 옵션 지원</p>\n<p><br><br></p>\n<h2 id=\"운영을-하면서-마주칠-수-있는-부분들\" style=\"position:relative;\"><a href=\"#%EC%9A%B4%EC%98%81%EC%9D%84-%ED%95%98%EB%A9%B4%EC%84%9C-%EB%A7%88%EC%A3%BC%EC%B9%A0-%EC%88%98-%EC%9E%88%EB%8A%94-%EB%B6%80%EB%B6%84%EB%93%A4\" aria-label=\"운영을 하면서 마주칠 수 있는 부분들 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>운영을 하면서 마주칠 수 있는 부분들</h2>\n<p>다음은 적용한 이후에 운영을 하다보면 마주칠 수 있는 이슈 또는 고민을 정리해보았습니다.<br></p>\n<p><strong>placeholder 리소스 설정</strong><br>\napplication submit 시 placeholder에 할당할 리소스 사이즈 결정이 필요합니다.\nplaceholder를 작게 설정하면 리소스 확보가 안되어 스케줄링에 영향이 있을 수 있고 지나치게 크게 설정하면 실제로 여유가 있음에도 리소스 부족 현상 발생할 수 있습니다. <a href=\"https://github.com/GoogleCloudPlatform/spark-on-k8s-operator\">spark-on-k8s-operator</a>를 사용한다면 스케줄러에 따라 placeholder 사이즈를 결정하는 로직이 포함되어 있으니 편하게 적용이 가능합니다.</p>\n<p><strong>큐 사이즈 조정</strong><br>\n만약 큐의 리소스 제한보다 요청한 리소스가 크다면 application reject이 발생하여 실행이 불가능합니다. 또한 큐의 크기가 전체적으로 작은 경우, 신규 요청한 어플리케이션이 빈번하게 대기하는 상황도 발생할 수 있습니다. 스케줄러에서 Prometheus 메트릭을 제공하니 Grafana를 통해 모니터링 후 적절한 큐 사이즈로 설정하는 과정이 필요합니다.</p>\n<p><strong>Spark Dynamic Resource Allocation을 사용하는 경우</strong><br>\n큐에서 이미 실행 중인 application은 리소스 확장도 가능합니다.\n따라서 Spark의 Dynamic Resource Allocation을 많이 사용한다면 미리 설정해둔 제한을 크게 넘어갈 수도 있습니다. 이러한 경우, 큐를 사용하는 의미가 사라지게 됩니다.</p>\n<p><strong>Application Cleanup 관련</strong><br>\n상황에 따라 application이 accepted 또는 waiting 상태에서 계속 머무르는 이슈가 발생할 수 있습니다. 이처럼 placeholder가 할당되지 못하는 경우, 스케줄러에서 timeout 설정을 통해 실패 처리되어야 다음 작업이 원활하게 진행될 수 있습니다. 만약 좀비 상태로 placeholder가 남는다면 core에서 확인 후 GC를 통해 정리됩니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<p>두 가지 스케줄러 모두 범용적으로 많이 사용되고 있어 운영 중인 환경에 따라 선택하시면 좋을 것 같습니다.<br>각 스케줄러에 대한 자세한 내용은 아래의 공식문서에서 찾아보실 수 있습니다!</p>\n<ul>\n<li><a href=\"https://yunikorn.apache.org/docs/\">https://yunikorn.apache.org/docs/</a></li>\n<li><a href=\"https://volcano.sh/en/\">https://volcano.sh/en/</a></li>\n</ul>","excerpt":"Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…"}}},{"id":"ef1e9cc8-27ee-57ae-acf6-96d41704b9a0","title":"Pandas 2.0의 Copy-on-Write에 대하여","slug":"pandas-2-0-copy-on-write","publishDate":"December 24, 2023","publishDateISO":"2023-12-24","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":7,"html":"<p>Pandas 2.0 버전부터 <code class=\"language-text\">Copy-on-Write (CoW)</code>가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write가 Pandas가 가진 문제를 어떻게 해결하는지에 대해 알아보겠습니다.</p>\n<ul>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-dataframe\">Pandas DataFrame</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-settingwithcopywarning\">Pandas SettingWithCopyWarning</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write\">Pandas Copy-on-Write</a></li>\n<li><a href=\"https://swalloow.github.io/pandas-2-0-copy-on-write/#pandas-copy-on-write-mode\">Pandas Copy-on-Write Mode</a></li>\n</ul>\n<br>\n<h2 id=\"pandas-dataframe\" style=\"position:relative;\"><a href=\"#pandas-dataframe\" aria-label=\"pandas dataframe permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas DataFrame</h2>\n<p>Pandas CoW에 대해 알아보기 이전에 먼저 DataFrame의 내부 구조에 대한 이해가 필요합니다.<br> <code class=\"language-text\">DataFrame</code>은 Pandas의 행, 열 기반 2차원 데이터 구조입니다.<br>\n초기에 Pandas는 아주 느린 컬럼 기반 연산을 빠르게 처리하기 위해 <code class=\"language-text\">BlockManager</code>를 추가했습니다.</p>\n<p><strong>BlockManager</strong><br>\nBlockManager는 numpy array로 저장된 데이터를 참조하는 블록을 관리하는 역할을 합니다.<br>\n아래 코드를 통해 자세히 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   c1 c2  c3\n<span class=\"token number\">0</span>   <span class=\"token number\">1</span>  a  <span class=\"token number\">10</span>\n<span class=\"token number\">1</span>   <span class=\"token number\">2</span>  b  <span class=\"token number\">20</span>\n<span class=\"token number\">2</span>   <span class=\"token number\">3</span>  c  <span class=\"token number\">30</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame을 생성하고 internal API를 통해 BlockManager 구조에 접근할 수 있습니다.<br>\n위 예시에서는 2개의 블록이 존재하며 그 중 int 타입을 가지는 <code class=\"language-text\">c1</code>, <code class=\"language-text\">c3</code>는 하나의 블록으로 통합되어 있습니다. 이처럼 BlockManager는 <strong>메모리 최적화와 효율적인 데이터 접근을 위해 동일한 타입을 하나의 블록으로 통합</strong>하여 관리합니다. 이번에는 동일한 타입을 가지는 <code class=\"language-text\">c4</code> 컬럼을 추가하고 다시 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span><span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token punctuation\">[</span><span class=\"token number\">100</span><span class=\"token punctuation\">,</span><span class=\"token number\">200</span><span class=\"token punctuation\">,</span><span class=\"token number\">300</span><span class=\"token punctuation\">]</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64</code></pre></div>\n<p>이번에는 새로운 블록이 추가된 것을 확인할 수 있습니다.<br>\n<strong>BlockManager는 새로운 블록이 추가될때마다 동일한 타입의 블록을 통합하지 않습니다.</strong></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>_data<span class=\"token punctuation\">.</span>consolidate<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\nBlockManager\nItems<span class=\"token punctuation\">:</span> Index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token string\">'c1'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c2'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c3'</span><span class=\"token punctuation\">,</span> <span class=\"token string\">'c4'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> dtype<span class=\"token operator\">=</span><span class=\"token string\">'object'</span><span class=\"token punctuation\">)</span>\nAxis <span class=\"token number\">1</span><span class=\"token punctuation\">:</span> RangeIndex<span class=\"token punctuation\">(</span>start<span class=\"token operator\">=</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> stop<span class=\"token operator\">=</span><span class=\"token number\">3</span><span class=\"token punctuation\">,</span> step<span class=\"token operator\">=</span><span class=\"token number\">1</span><span class=\"token punctuation\">)</span>\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token punctuation\">[</span><span class=\"token number\">0</span> <span class=\"token number\">2</span> <span class=\"token number\">3</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> int64\nNumpyBlock<span class=\"token punctuation\">:</span> <span class=\"token builtin\">slice</span><span class=\"token punctuation\">(</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> x <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> dtype<span class=\"token punctuation\">:</span> <span class=\"token builtin\">object</span></code></pre></div>\n<p>DataFrame 연산이 실행되기 직전에 <code class=\"language-text\">consolidate()</code> 메서드를 통해 자동으로 통합합니다.<br>\n구체적으로는 블록 통합이 연산에 유리한 경우에만 블록 통합이 이루어집니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-settingwithcopywarning\" style=\"position:relative;\"><a href=\"#pandas-settingwithcopywarning\" aria-label=\"pandas settingwithcopywarning permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas SettingWithCopyWarning</h2>\n<p>앞서 Pandas가 BlockManager를 통해 어떻게 블록을 관리하는지 알아보았습니다.<br>\n이번에는 CoW에서 해결하고자 하는 <code class=\"language-text\">SettingWithCopyWarning</code> 문제에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n\ndf <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     A\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>위와 같은 DataFrame에서 첫 번째 행의 <code class=\"language-text\">grade</code> 값을 E로 변경해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">grades <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"grade\"</span><span class=\"token punctuation\">]</span>\ngrades<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"E\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D\n\nSettingWithCopyWarning<span class=\"token punctuation\">:</span> \nA value <span class=\"token keyword\">is</span> trying to be <span class=\"token builtin\">set</span> on a copy of a <span class=\"token builtin\">slice</span> <span class=\"token keyword\">from</span> a DataFrame</code></pre></div>\n<p>코드만 보면 <code class=\"language-text\">grade</code> 변수에만 변경내용이 적용된 것처럼 보입니다.<br>\n하지만 실제로는 <code class=\"language-text\">df</code> 내용도 변경되어 있으며 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타납니다.\n<code class=\"language-text\">ChainedIndexing</code>을 사용한 다른 예시도 확인해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">[</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"student_id\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">></span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"grades\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token string\">\"F\"</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">)</span>\n\n   student_id grade\n<span class=\"token number\">0</span>           <span class=\"token number\">1</span>     E\n<span class=\"token number\">1</span>           <span class=\"token number\">2</span>     C\n<span class=\"token number\">2</span>           <span class=\"token number\">3</span>     D</code></pre></div>\n<p>이번에도 <code class=\"language-text\">SettingWithCopyWarning</code> 경고 문구가 나타나며 <code class=\"language-text\">df</code>에는 어떠한 변화도 없는 것을 확인할 수 있습니다.\n이러한 문제가 발생하는 <strong>원인은 Pandas, Numpy가 내부적으로 view 또는 copy를 반환하는 방식</strong>에서 찾아볼 수 있습니다.</p>\n<p><strong>Views and Copies</strong><br></p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n\norigin <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\nview <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>view<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ncopy <span class=\"token operator\">=</span> origin<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n\narr<span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">3</span>\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>origin<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>view<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n\n<span class=\"token keyword\">print</span><span class=\"token punctuation\">(</span>copy<span class=\"token punctuation\">)</span>\narray<span class=\"token punctuation\">(</span><span class=\"token punctuation\">[</span><span class=\"token number\">1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">6</span><span class=\"token punctuation\">,</span> <span class=\"token number\">4</span><span class=\"token punctuation\">,</span> <span class=\"token number\">8</span><span class=\"token punctuation\">,</span> <span class=\"token number\">9</span><span class=\"token punctuation\">,</span> <span class=\"token number\">2</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 코드 결과를 보면 <code class=\"language-text\">origin</code>, <code class=\"language-text\">view</code>는 변경된 값으로 반영되어 있지만 <code class=\"language-text\">copy</code>는 반영안되어 있는 것을 확인할 수 있습니다. <strong>view는 자체적으로 데이터가 없는 numpy 배열</strong> 입니다. 반면에 <strong>copy는 원본 배열의 요소를 새 배열에 복사하여 전체 복사본의 데이터</strong>를 가지고 있습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 44.583333333333336%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAASCAAAAAAMdMN6AAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAASVJREFUKM+t0c1OAkEQBGDf/2l8BY8mRgkmyp+CsDM7Mz3dPbvsH+xCeYHjGkis83eo6n7AjXm4Bw5ifSpaoGIfRAG0JnfiWCw751KqLzAimgAZ8s0hmMqTmNehyBfsSjujz9BGukDCdj5Hlj42ZbabuXOuL2iDl+MQyHehIrnAswSb0QFolTQGCDpRis5xYE+e8mZkDI+N6bkQlgoo1BtPsGMwIc09VubtqdmuWGU2BrWvs4iI4quO8Vv+OLgkjjoArTMZVf/xGWJNqQVYoycCUFPI1ZI4tm6bdH/tCFkYZDp9bn6WUYzJHnv2E2OSm9C73e/4AnlIyzUI5a4RXitwnuLom+x0ihUNrqv12pGTsgxAo96GEkDvAwtHYYosErp7x9yUX0lStk5vCENkAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxNDU4szskLwAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANjUwowVD2wAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"view-copy\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=240 240w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=480 480w,\nhttps://images.ctfassets.net/tushy4jlcik7/RKHHbP0caT2iSgCohNwSj/a66eab638f2a77b5f452ccabfc866a67/view-copy.png?w=960 960w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이처럼 view, copy에 따라 원본 객체인지 아닌지 달라지며 이는 일관된 동작을 보장하지 못하게 됩니다.<br>\n결국 <code class=\"language-text\">SettingWithCopyWarning</code>은 코드에서 사용자가 의도하지 않은 동작이 발생할 가능성이 있음을 경고하는 warning 입니다. 이 문제를 해결하기 위해 Pandas 2.0에 <code class=\"language-text\">Copy-on-Write</code>가 추가되었습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write\" aria-label=\"pandas copy on write permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write</h2>\n<p>Pandas Copy-on-Write는 <strong>다른 DataFrame으로부터 생성된 모든 DataFrame이 항상 복사본으로 동작하도록 보장</strong>합니다. 다시 말해, 더 이상 단일 연산으로 두 가지 이상의 객체가 수정될 수 없습니다. (ex. 처음 예시에서 grade만 변경되고 df는 변경되지 않음)</p>\n<p>이를 구현하기 위한 가장 쉬운 방법은 항상 데이터를 복사하는 방법입니다.<br>\n하지만 적용 시 성능이 크게 떨어지기 때문에 다른 방식을 적용해야 했습니다.</p>\n<p><strong>BlockValuesRefs</strong><br>\n불필요한 복사를 방지하려면 복사를 트리거할 시기를 정확히 알아야 합니다.<br>\n결국 DataFrame 데이터가 다른 DataFrame과 공유되는 경우에만 복사를 트리거해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span>\ndf2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">[</span><span class=\"token punctuation\">:</span><span class=\"token punctuation\">]</span></code></pre></div>\n<p>위 코드에서는 <code class=\"language-text\">df</code>와 df의 view 객체인 <code class=\"language-text\">df2</code>를 생성합니다.<br>\n현재 <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 동일한 numpy 배열을 참조하고 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p>코드를 통해 둘 중 하나가 수정되는 경우, 복사가 트리거됩니다.<br>\n이 때 다른 Pandas 객체가 참조하고 있는지를 추적해야 합니다.<br>\n이를 위해 <code class=\"language-text\">BlockValuesRefs</code>가 추가되었습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 29.48453608247423%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAMCAAAAAA1qKCRAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUBzIcKObEjAAAAJBJREFUGNOd0UELgjAch2G///eJTkEgHcVL1mjIZNOWazq11GDNtekxldV7+jEe+B/mace8fyEGjlA8neBjbB2SYxAOGHJ+xtNDz0y5+oItb4QGMSHoZAWDoW4GpfP501GAfHgZZ3e973dAsnmIaI3TJO5ttNhsD90CpNJE07ctk+JWvRZgWZjKaSu7q99/5gMaJ9RINcOn7wAAABJ0RVh0ZXhpZjpFeGlmT2Zmc2V0ADc4ydR7JwAAABh0RVh0ZXhpZjpQaXhlbFhEaW1lbnNpb24AOTcwB2CHEgAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24AMjg2+MEwfwAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref1\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=243 243w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=485 485w,\nhttps://images.ctfassets.net/tushy4jlcik7/2D9OCQfiqBrPnFVvYCKhpd/dc7eedf889af33d58efa757176b0e380/ref1.png?w=970 970w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 numpy 배열을 감싸고 이 참조를 내부적으로 저장하는 블록을 가리키는 <code class=\"language-text\">weakref</code>를 생성합니다.\n위의 예시와 같이 동일한 타입의 <code class=\"language-text\">a</code>, <code class=\"language-text\">b</code> 컬럼은 BlockManager를 통해 하나의 블록에 존재합니다.\n그리고 블록에 대해 <code class=\"language-text\">weakref</code>를 가지는 Block Reference Tracker가 추가됩니다.<br>\n이제 다음 예시에서 새로운 블록을 추가해보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span>drop<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 53.276955602537%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAVCAAAAAARcfPCAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAOJJREFUKM+lkssOgjAQRfn/r3BvXLnRjRs16kZIiCBoMAgRGIEorwpUkFcIESokzmI6bU467dxLpQODqiufGQi6ykBwaGvtfDhikQWeBqM8sSELvwVaNx1iQQBRBC4nYBXiKEm17tYn7kJfqxvZSJptkEEAVVWWTLaoDbScTwUCWB6vvTyUMNB0TGhtAvAAcVGjiSJ3faZmq9WD4NU9x+Sd5/0CFbun5YeEgW9HjWfajy+u1drZ5fnuunGfMlymjIZcTJSwoQwTebjHFJUyTtLnnlKZcb/NjEb+CZqFb+K/jPsBbicygU39RNwAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAYdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADk0NsUuceQAAAAYdEVYdGV4aWY6UGl4ZWxZRGltZW5zaW9uADUwNNtZzd4AAABcdEVYdGV4aWY6VXNlckNvbW1lbnQANjUsIDgzLCA2NywgNzMsIDczLCAwLCAwLCAwLCA4MywgOTksIDExNCwgMTAxLCAxMDEsIDExMCwgMTE1LCAxMDQsIDExMSwgMTE2QLgfcgAAACh0RVh0aWNjOmNvcHlyaWdodABDb3B5cmlnaHQgQXBwbGUgSW5jLiwgMjAyM5OzjwoAAAAXdEVYdGljYzpkZXNjcmlwdGlvbgBEaXNwbGF5FxuVuAAAAABJRU5ErkJggg=='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref2\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=237 237w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=473 473w,\nhttps://images.ctfassets.net/tushy4jlcik7/4239ZGl27LRzj0fIxiW2Ut/149499a3ad41a0c2635bdd04fd9e9006/ref2.png?w=946 946w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">BlockValuesRefs</code>는 이제 <code class=\"language-text\">df</code>를 위한 블록과 <code class=\"language-text\">df2</code>를 위해 새로 생성된 블록을 가리킵니다.\n이를 통해 동일한 메모리를 가리키는 모든 DataFrame을 항상 인식할 수 있습니다.\n동일한 numpy 배열을 가리키는 블록이 몇 개 남아 있는지 참조 추적 객체를 통해 알아낼 수 있습니다.\n이러한 과정을 통해 <strong>둘 중 하나가 내부에서 수정되면 내부적으로 복사본을 트리거</strong>할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 46.99646643109541%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAATCAAAAADHKBDfAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAALtJREFUKM+tkc0OgjAQhHn/FyLxYjSBG1IjkajEH4wF2q4gSlGiYlvPGwg6p0n6ZXZ3arU9ZQ0Amf/nxHueV4JCHPMOEJbbEw1ht95LJRoLpRIbzecrL0wNyH07aAADRSEFzKCuZM2J7TxQkINS9tI2VU7I33rsDS7G/RNrvWPVASaut4FjC4fvqWd9zBNLpAAUIh3rZWUoWrQeNiEjJ2nMR01dckNB8xDkunCWkQhPvOqpF2MLveN7QI8fk+7mlpyP+4AAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMzIDf6hcAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzIZFzsoAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref3\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=283 283w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=566 566w,\nhttps://images.ctfassets.net/tushy4jlcik7/2KJYLOXOASBuJ8ixTCW5pE/ec5eb23be8f4a9289113ce8f2970269b/ref3.png?w=1132 1132w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이제 <code class=\"language-text\">df2</code>의 블록은 전체 복사를 통해 복사되어 자체 데이터와 <code class=\"language-text\">BlockValuesRefs</code>가 있는 새로운 블록을 생성합니다. <code class=\"language-text\">df</code>와 <code class=\"language-text\">df2</code>는 더 이상 메모리를 공유하지 않습니다.<br>\n이해를 위해 몇 가지 상황을 더 살펴보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> <span class=\"token boolean\">None</span>\ndf2<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAAPdJREFUKM+NkttqwkAQhn3/FxKhFyIeA23BIK3R1ljrsslMqtlNo1XH7a7BHiCT+F0Mu/DxDzNMw9xI4/d50P/IWVGfmkR0Iiqq4kX661FakWgNCesIEqoUo77nbeIXSGJwoekHWmRpaxs5f1suRQCW8b3xHgwyrckfTHqj6OCGwee7zgS5YcDZwyTLdCTM/ElDibhVSqXhqx+GIrXP+HG6QNQlYsH5mgG5YqY259nOlu7s8pF7xa3HZAPXqEgUe83usQjClsQtrb8++aPI+iNP4QI3iRTHXcX1XAjE6j0OjrmpE/32uDNsa1Mr4k+pEcFdgr5BZPkGs4ALXD98v7wAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADEwNjCRxFcCAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1MzD3GVoEAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref4\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=265 265w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=530 530w,\nhttps://images.ctfassets.net/tushy4jlcik7/59lcqpTQ7nXgJwhI2HjJq8/8ca826f0fe02648afe9c3a01323eaeee/ref4.png?w=1060 1060w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>이 경우에는 <code class=\"language-text\">df2</code>를 수정하기 전 <code class=\"language-text\">df</code>가 <code class=\"language-text\">None</code>이 됩니다.\n결국 <code class=\"language-text\">df</code> <code class=\"language-text\">BlockValuesRefs</code>의 <code class=\"language-text\">weakref</code>는 None으로 평가되며, 이를 통해 복사를 실행하지 않아도 <code class=\"language-text\">df2</code>를 수정할 수 있습니다.\n마지막으로 <code class=\"language-text\">BlockValuesRefs</code> 객체는 복사를 트리거하지 않고 하나의 DataFrame만 가리키면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df2 <span class=\"token operator\">=</span> df<span class=\"token punctuation\">.</span>copy<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 50.67437379576107%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANRJREFUKM+tktsOgjAMQPn///HRIEYjgah4SRQUlBAWt9UYEscdJ4P4OEBjH5o+nK3t2RQ+MJQfQMv7940l5w+AAFPWDe5140Ahoh6H5hiCOoikdejbThA6AjFQph05lYB0bdqGH7S1po5dKdhkjbE4Zii7nF5YAsYAdd+qqZkYIJXqYVG/HhTW6TahveDGF5kMepkIYAQ07RE+b4WfW+Eci2XuMuE4vBLcCNdRMe0QvlC3M3eX51mSEG1lXruFW0VRlhWNrWUhA5+iKeSfxQDY9//xDeBlC0hORSNyAAAAEnRFWHRleGlmOkV4aWZPZmZzZXQANzjJ1HsnAAAAGXRFWHRleGlmOlBpeGVsWERpbWVuc2lvbgAxMDM44mgrdQAAABh0RVh0ZXhpZjpQaXhlbFlEaW1lbnNpb24ANTI2B2HOcAAAAFx0RVh0ZXhpZjpVc2VyQ29tbWVudAA2NSwgODMsIDY3LCA3MywgNzMsIDAsIDAsIDAsIDgzLCA5OSwgMTE0LCAxMDEsIDEwMSwgMTEwLCAxMTUsIDEwNCwgMTExLCAxMTZAuB9yAAAAKHRFWHRpY2M6Y29weXJpZ2h0AENvcHlyaWdodCBBcHBsZSBJbmMuLCAyMDIzk7OPCgAAABd0RVh0aWNjOmRlc2NyaXB0aW9uAERpc3BsYXkXG5W4AAAAAElFTkSuQmCC'); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref5\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=260 260w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=519 519w,\nhttps://images.ctfassets.net/tushy4jlcik7/46iwHfm29GfeSWfKvX58fz/ac17e591224ce0112dbf2f63468c985a/ref5.png?w=1038 1038w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p><code class=\"language-text\">copy</code>를 실행하는 경우는 간단합니다. DataFrame <code class=\"language-text\">df2</code>에 대한 새로운 <code class=\"language-text\">BlockValuesRefs</code>가 즉시 생성되며 데이터를 공유하지 않습니다.</p>\n<br>\n<p><strong>Optimizing inplace copies</strong><br>\n앞서 복사를 트리거하는 시점에 대해 알아보았습니다.<br>\n이번에는 복사본을 최대한 효율적으로 생성하는 방법에 대해 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>iloc<span class=\"token punctuation\">[</span><span class=\"token number\">0</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> <span class=\"token number\">100</span></code></pre></div>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 33.489618218352305%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAANCAAAAAD+9HM0AAAACXBIWXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH6AEUCC0zRTGwdgAAAMFJREFUKM+N0N0OwUAQBWDv/0zceACpvwYpqZQlutudGa0UWcdFi9o2Ya42J1/OZKeHP6cH4KzaedEBHVNud6xF9N7kdb7ugHeVnkzMaSbpJjVVrBaRTcasDKv15Ojq1YAACMPwWr0AOOc0WdbEmuy+AUXEColI9t5FwHISTMcXyAcCgHq11WOIyJIlIvUFH1rmN/8HW1DzPAAAxrJgH5aIWlDi/kw8lyVxYnx4tbLKPUiDYUA+RAm/EOYwiluNv+YJxiv6nSLv3aYAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref6\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=373 373w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=747 747w,\nhttps://images.ctfassets.net/tushy4jlcik7/3fJ8S8VGWGaCkq06jPf8zB/835a17c800496fb37b83b3a434f60083/ref6.png?w=1493 1493w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 예시는 DataFrame에 n개의 정수 컬럼이 있으며 모두 하나의 블록으로 통합되어 있습니다.\n다른 블록에서도 DataFrame을 참조하고 있기 때문에 하나의 값을 수정하기 위해 전체 블록을 복사해야 하는 상황입니다.\n이 방식은 위 그림과 같이 복사할 필요가 없는 n-1개의 컬럼을 복사해야 합니다.\nCoW에서는 이러한 상황을 최적화하기 위해 <code class=\"language-text\">Block Splitting</code>을 추가했습니다.</p>\n<p><span\n        class=\"gatsby-resp-image-wrapper\"\n        style=\"position: relative; display: block; ; max-width: 650px; margin-left: auto; margin-right: auto;\"\n      >\n        <span\n          class=\"gatsby-resp-image-background-image\"\n          style=\"padding-bottom: 48.84135472370767%; position: relative; bottom: 0; left: 0; background-image: url('data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACgAAAAUCAAAAADaLSBnAAAACXBIWXMAABYlAAAWJQFJUiTwAAAAB3RJTUUH6AEUCC0zRTGwdgAAANNJREFUKM+t0mFLwmAUxXG//9cJKoiQEMKEalBhwp4a2mxu5yrPllNa7e8b36UPozqvf9x7uZweHdP7BTz/54n1+HlsGj3IPY1mTpIrriaL6if88r6UXjLFs2QxVaqp4izzh1db/3o4MMAnr+kS+DwGORu0BpTxPM5DMJcKJ0m5VEg6dCMArsQAiPhehd6zYQ/rMNym0mUNrFJN7gNQxXuyFKDq7aO149CGJxeRAXn/9GYdgs1dVBtg81tHAFaS5IEik3tsupRiQ6NO7dnSrv9e3HB21tUMpLgn8qcAAAASdEVYdGV4aWY6RXhpZk9mZnNldAA3OMnUeycAAAAZdEVYdGV4aWY6UGl4ZWxYRGltZW5zaW9uADExMjIaZJkdAAAAGHRFWHRleGlmOlBpeGVsWURpbWVuc2lvbgA1NDi2g0TxAAAAXHRFWHRleGlmOlVzZXJDb21tZW50ADY1LCA4MywgNjcsIDczLCA3MywgMCwgMCwgMCwgODMsIDk5LCAxMTQsIDEwMSwgMTAxLCAxMTAsIDExNSwgMTA0LCAxMTEsIDExNkC4H3IAAAAodEVYdGljYzpjb3B5cmlnaHQAQ29weXJpZ2h0IEFwcGxlIEluYy4sIDIwMjOTs48KAAAAF3RFWHRpY2M6ZGVzY3JpcHRpb24ARGlzcGxheRcblbgAAAAASUVORK5CYII='); background-size: cover; display: block;\"\n        >\n          <img\n        class=\"gatsby-resp-image-image\"\n        style=\"width: 100%; height: 100%; margin: 0; vertical-align: middle; position: absolute; top: 0; left: 0; box-shadow: inset 0px 0px 0px 400px white;\"\n        alt=\"ref7\"\n        title=\"\"\n        src=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png\"\n        srcset=\"https://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=281 281w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=561 561w,\nhttps://images.ctfassets.net/tushy4jlcik7/3hAt9dVwj7X0HOcRNPPKsR/8827b8e9237d7982ba4dd37b31dc596d/ref7.png?w=1122 1122w\"\n        sizes=\"(max-width: 650px) 100vw, 650px\"\n        loading=\"lazy\"\n      />\n        </span>\n      </span></p>\n<p>위 그림과 같이 <code class=\"language-text\">Block Splitting</code>을 통해 분할되어 내부적으로 첫 번째 컬럼만 복사됩니다.\n다른 모든 컬럼은 이전 배열의 view로 간주되며 새로운 블록은 다른 열과 참조를 공유하지 않습니다.\n이전 블록은 view일 뿐이므로 그대로 다른 객체와 참조를 공유합니다.\n<strong>이 방식은 불필요한 복사를 방지할 수 있지만 이전 블록에 대한 정보에 새로운 블록까지 추가하므로 더 많은 메모리를 사용한다는 단점</strong>이 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"pandas-copy-on-write-mode\" style=\"position:relative;\"><a href=\"#pandas-copy-on-write-mode\" aria-label=\"pandas copy on write mode permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Pandas Copy-on-Write Mode</h2>\n<p>Pandas CoW를 통해 <strong>복사에 대한 지연, 최적화를 통해 빠른 성능</strong>을 얻을 수 있으며\n<strong>DataFrame의 일관된 동작을 보장</strong>할 수 있습니다.\n2.0 버전의 경우, 간단한 설정만 추가하면 <code class=\"language-text\">Copy-on-Write</code> 모드를 사용할 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">pd<span class=\"token punctuation\">.</span>options<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">.</span>copy_on_write <span class=\"token operator\">=</span> <span class=\"token boolean\">True</span></code></pre></div>\n<p>간단한 체이닝 연산을 통해 수행 시간의 차이를 확인해보면 다음과 같습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token operator\">%</span><span class=\"token operator\">%</span>timeit\n<span class=\"token punctuation\">(</span>\n    df<span class=\"token punctuation\">.</span>rename<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>assign<span class=\"token punctuation\">(</span>sum_val<span class=\"token operator\">=</span>df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_1\"</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">+</span> df<span class=\"token punctuation\">[</span><span class=\"token string\">\"col_2\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>drop<span class=\"token punctuation\">(</span>columns<span class=\"token operator\">=</span><span class=\"token punctuation\">[</span><span class=\"token string\">\"col_10\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"col_20\"</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>astype<span class=\"token punctuation\">(</span><span class=\"token punctuation\">{</span><span class=\"token string\">\"col_5\"</span><span class=\"token punctuation\">:</span> <span class=\"token string\">\"int32\"</span><span class=\"token punctuation\">}</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>reset_index<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token punctuation\">.</span>set_index<span class=\"token punctuation\">(</span><span class=\"token string\">\"new_index\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># without CoW</span>\n<span class=\"token number\">2.45</span> s ± <span class=\"token number\">293</span> ms per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">1</span> loop each<span class=\"token punctuation\">)</span>\n\n<span class=\"token comment\"># with CoW</span>\n<span class=\"token number\">13.7</span> ms ± <span class=\"token number\">286</span> µs per loop <span class=\"token punctuation\">(</span>mean ± std<span class=\"token punctuation\">.</span> dev<span class=\"token punctuation\">.</span> of <span class=\"token number\">7</span> runs<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span> loops each<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예시에서는 대략 200배 정도 개선되었지만 연산에 따라 결과는 다를 수 있습니다.<br>\n특히 <code class=\"language-text\">drop(axis=1)</code>, <code class=\"language-text\">rename()</code>과 같은 연산에서 큰 성능 향상을 확인하실 수 있습니다.</p>\n<p><br><br></p>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://realpython.com/pandas-settingwithcopywarning/\">https://realpython.com/pandas-settingwithcopywarning/</a></li>\n<li><a href=\"https://pandas.pydata.org/docs/user_guide/copy_on_write.html\">https://pandas.pydata.org/docs/user_guide/copy_on_write.html</a></li>\n<li><a href=\"https://pandas.pydata.org/pdeps/0007-copy-on-write.html\">https://pandas.pydata.org/pdeps/0007-copy-on-write.html</a></li>\n<li><a href=\"https://phofl.github.io/cow-deep-dive.html\">https://phofl.github.io/cow-deep-dive.html</a></li>\n</ul>","excerpt":"Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…"}}},{"id":"94eeb309-1ab1-58ad-af4b-9e354444e47b","title":"Data Science inconvenient truth","slug":"data-science-inconvenient-truth","publishDate":"April 01, 2018","publishDateISO":"2018-04-01","heroImage":{"title":"cover-datascience","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&q=50&fm=webp 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&q=50&fm=webp 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&q=50&fm=webp 1800w","sizes":"(min-width: 1800px) 1800px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=450&h=300&fl=progressive&q=50&fm=jpg 450w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=900&h=600&fl=progressive&q=50&fm=jpg 900w,\nhttps://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&h=1200&fl=progressive&q=50&fm=jpg 1800w","sizes":"(min-width: 1800px) 1800px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEASABIAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGQAAAgMBAAAAAAAAAAAAAAAAAAQBAwUG/8QAHxAAAgEEAgMAAAAAAAAAAAAAAQIAAwQRIQVCExSR/8QAFgEBAQEAAAAAAAAAAAAAAAAAAQAC/8QAFhEBAQEAAAAAAAAAAAAAAAAAAQAR/9oADAMBAAIRAxEAPwCthE7ioFIBOznEy05C8uWI8wpjHVZCF3uFSpUd99m18kpIXSYyTqES96ouiFMJnScb/9k="}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/5l0PQJpz5C5IDFjHYigWJI/389fe4852b9cb39e9ada4938db33e6ca/cover_datascience.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<h2 id=\"데이터과학의-불편한-진실\" style=\"position:relative;\"><a href=\"#%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99%EC%9D%98-%EB%B6%88%ED%8E%B8%ED%95%9C-%EC%A7%84%EC%8B%A4\" aria-label=\"데이터과학의 불편한 진실 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>데이터과학의 불편한 진실</h2>\n<ul>\n<li>Data is never clean (데이터는 절대 깨끗하지 않다)</li>\n<li>You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다)</li>\n<li>95% of tasks do not require deep learning (95% 일은 Deep Learning을 필요로 하지 않는다)</li>\n<li>In 90% of cases generalized linear regression will do the trick (실제 분석의 90%는 GLM으로 해결된다 )</li>\n<li>Big Data is just a tool (빅 데이터는 단지 도구일 뿐이다)</li>\n<li>You should embrace the Bayesian approach (당신은 베이지안 접근을 포용해야 한다)</li>\n<li>No one cares how you did it (사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다)</li>\n<li>Academia and business are two different worlds (학계와 산업계는 서로 다른 세계이다)</li>\n<li>Presentation is key - be a master of Power Point (프리젠테이션이 핵심이다: PowerPoint의 마스터가 되라)</li>\n<li>All models are false, but some are useful (모든 모델은 틀렸다, 하지만 몇몇은 유용하다)</li>\n<li>There is no fully automated Data Science. You need to get your hands dirty (완전 자동화된 데이터 과학같은 것은 없다. 인간이 개입되어야 할 부분이 있다)</li>\n</ul>\n<br>\n<p>Ref: <a href=\"https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html\">https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html</a></p>","excerpt":"데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your…"}}},{"id":"cd93f129-9906-59b5-84e8-6a1fff1e7e00","title":"제플린 노트북 자동 실행 스크립트 만들기","slug":"zeppelin-bootstrap","publishDate":"September 13, 2017","publishDateISO":"2017-09-13","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf 등록을 위해 처음 실행시켜야 하는 노트북이 있다면 참 번거롭습니다.\n하지만 <strong>Zeppelin Notebook API</strong> 사용한다면 이를 쉽게 자동화 할 수 있습니다.</p>\n<br>\n<h2 id=\"zeppelin-notebook-api\" style=\"position:relative;\"><a href=\"#zeppelin-notebook-api\" aria-label=\"zeppelin notebook api permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Zeppelin Notebook API</h2>\n<p>제플린은 노트북 자동실행을 위한 REST API를 제공합니다.\n하지만 제플린에 인증이 걸려있다면, 인증을 거쳐야만 API를 사용할 수 있습니다.\n따라서, 먼저 curl로 세션 값을 받고 해당 노트북 아이디를 호출하시면 됩니다.</p>\n<p>노트북 아이디는 해당 노트 URL의 가장 마지막 값 입니다. (ex 2AZPHY918)\n아래의 스크립트는 아이디가 user, 패스워드가 1234인 경우를 예시로 들었습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">#!/bin/sh\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop\nsleep 3\nsudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh start\n\nsleep 15\n\nSESSION=\"`curl -i --data 'userName=user&amp;password=1234)' -X POST http://zeppelin-url.com:8890/api/login | grep 'Set-Cookie: JSESSIONID=' | cut -d ':' -f2 |  tail -1 | cut -d ';' -f1`\"\necho $SESSION\ncurl -i -b ${SESSION} -X POST http://zeppelin-url.com:8890/api/notebook/job/NOTEBOOK_ID</code></pre></div>\n<p>Notebook API를 활용하면 노트북 실행 뿐만 아니라, Cron이나 노트북 권한 설정도 자동화할 수 있습니다.\n자세한 내용은 아래의 공식문서에서 확인하실 수 있습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html\">https://zeppelin.apache.org/docs/0.7.3/rest-api/rest-notebook.html</a></li>\n</ul>\n<br>","excerpt":"제플린 노트북을 사용하다보면 가끔 제플린 어플리케이션을 재시작해야 하는 경우가 있습니다.\n이 때, view 또는 udf…"}}},{"id":"0bf44cfd-a95d-5c55-a158-812503a3e3f3","title":"Spark DataFrame을 MySQL에 저장하는 방법","slug":"spark-df-mysql","publishDate":"July 17, 2017","publishDateISO":"2017-07-17","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.1.0 버전을 사용 중 입니다.</p>\n<br>\n<h2 id=\"mysql-jdbc-driver\" style=\"position:relative;\"><a href=\"#mysql-jdbc-driver\" aria-label=\"mysql jdbc driver permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL JDBC Driver</h2>\n<p>JDBC를 통해 접근하기 때문에 드라이버가 필요합니다.\n만일 SBT를 사용하신다면, build.sbt에 maven의 <code class=\"language-text\">mysql-connector-java</code> 를 추가하시면 됩니다.</p>\n<p>직접 jar 파일을 사용해야하는 상황이라면, 다음 링크를 통해 다운받으시면 됩니다.\n<a href=\"https://dev.mysql.com/downloads/connector/j/\">https://dev.mysql.com/downloads/connector/j/</a></p>\n<p>그리고 받으신 jar 파일을 -jars 옵션으로 추가해주셔야 합니다.</p>\n<p><code class=\"language-text\">–jars /home/example/jars/mysql-connector-java-5.1.26.jar</code></p>\n<p>마지막으로 spark-submit 을 사용하신다면, --packages 옵션을 추가해주시면 됩니다.</p>\n<p><code class=\"language-text\">--packages mysql:mysql-connector-java:5.1.39</code></p>\n<br>\n<h2 id=\"spark-dataframe-mysql\" style=\"position:relative;\"><a href=\"#spark-dataframe-mysql\" aria-label=\"spark dataframe mysql permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark DataFrame MySQL</h2>\n<p>Spark의 DataFrame은 read, write 함수를 통해 쉽게 데이터를 가져오거나 저장할 수 있습니다.\n아래 예시는 Scala 언어로 작성했습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"scala\"><pre class=\"language-scala\"><code class=\"language-scala\"><span class=\"token keyword\">import</span> <span class=\"token namespace\">org<span class=\"token punctuation\">.</span>apache<span class=\"token punctuation\">.</span>spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">.</span></span>SaveMode\n<span class=\"token keyword\">import</span> <span class=\"token namespace\">java<span class=\"token punctuation\">.</span>util<span class=\"token punctuation\">.</span></span>Properties\n\n<span class=\"token keyword\">val</span> tempDF <span class=\"token operator\">=</span> List<span class=\"token punctuation\">(</span><span class=\"token punctuation\">(</span><span class=\"token string\">\"1\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-01\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"2017-06-03\"</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>toDF<span class=\"token punctuation\">(</span><span class=\"token string\">\"id\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"start\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"end\"</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">val</span> properties <span class=\"token operator\">=</span> <span class=\"token keyword\">new</span> Properties<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"user\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"userId\"</span><span class=\"token punctuation\">)</span>\nproperties<span class=\"token punctuation\">.</span>put<span class=\"token punctuation\">(</span><span class=\"token string\">\"password\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"password\"</span><span class=\"token punctuation\">)</span>\ntempDF<span class=\"token punctuation\">.</span>write<span class=\"token punctuation\">.</span>mode<span class=\"token punctuation\">(</span>SaveMode<span class=\"token punctuation\">.</span>Append<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>jdbc<span class=\"token punctuation\">(</span><span class=\"token string\">\"jdbc:mysql://url/database\"</span><span class=\"token punctuation\">,</span> <span class=\"token string\">\"table\"</span><span class=\"token punctuation\">,</span> properties<span class=\"token punctuation\">)</span></code></pre></div>\n<p>위 예제에서는 Properties를 통해 설정값을 넣어주었습니다.\n유저 정보나 주소는 맞게 변경해주시면 됩니다.</p>\n<p>mode 라는 것이 있는데 <code class=\"language-text\">SaveMode.Append</code>는 기존의 테이블에 추가하는 방식이고\n<code class=\"language-text\">SaveMode.Overwrite</code>의 경우 기존의 테이블을 새로운 데이터로 대체하는 방식입니다.</p>\n<br>","excerpt":"Spark에서 MySQL에 접근하고 DataFrame을 read, write 하는 방법에 대해 정리해보았습니다.\n참고로 저는 Spark 2.…"}}},{"id":"c78e09d9-7707-54ec-863b-69e21551e3b0","title":"AWS EMR step을 이용한 Spark Batch 작업","slug":"emr-step","publishDate":"July 02, 2017","publishDateISO":"2017-07-02","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>AWS EMR은 특정 작업을 등록할 수 있는 <strong>step</strong> 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch 작업이 있다면 step과 스케줄러를 통해 쉽게 해결할 수 있습니다.</p>\n<br>\n<h2 id=\"emr-step\" style=\"position:relative;\"><a href=\"#emr-step\" aria-label=\"emr step permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>EMR Step</h2>\n<p>Step은 AWS console 내에서 추가해도 되지만, AWS-Cli를 이용해서 등록해보도록 하겠습니다.\nAWS-Cli로 등록하면 이후에 스크립트로 활용할 수도 있다는 편리함이 있습니다.</p>\n<p>AWS EMR step을 등록하는 방법은 아래와 같습니다.\n가독성을 위해 줄바꿈, 띄어쓰기를 했지만 실제로 등록할 때는 전부 붙이셔야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr add-steps\n    --cluster-id <span class=\"token variable\">$CLUSTERID</span>,\n    <span class=\"token parameter variable\">--steps</span> <span class=\"token assign-left variable\">Name</span><span class=\"token operator\">=</span><span class=\"token variable\">$JOBNAME</span>,\n    <span class=\"token assign-left variable\">Jar</span><span class=\"token operator\">=</span><span class=\"token variable\">$JARFILE</span>,\n    <span class=\"token assign-left variable\">Args</span><span class=\"token operator\">=</span><span class=\"token punctuation\">[</span>\n        /usr/lib/spark/bin/spark-submit,\n        --deploy-mode,client,\n        --properties-file,/etc/spark/conf/spark-defaults.conf,\n        --conf,spark.yarn.executor.memoryOverhead<span class=\"token operator\">=</span><span class=\"token number\">2048</span>,\n        --conf,spark.executor.memory<span class=\"token operator\">=</span>4g,\n        --packages,<span class=\"token variable\">$SPARK_PACKAGES</span>\n    <span class=\"token punctuation\">]</span>,\n    <span class=\"token assign-left variable\">ActionOnFailure</span><span class=\"token operator\">=</span><span class=\"token variable\">${ACTION_ON_FAIL}</span>'</code></pre></div>\n<p>Spark 작업 실행은 <code class=\"language-text\">Spark-submit</code>을 이용하여 클라이언트에 배포하는 형식입니다.\n이를 위해 jar 파일이 클라이언트의 로컬 경로에 포함되어 있어야 합니다.\nActionOnFailure를 통해 실패 시 Terminate, Stop 등의 옵션을 지정할 수 있습니다.</p>\n<p>만약 등록한 작업을 취소하고 싶다면, <code class=\"language-text\">cancel-steps</code>를 이용하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"bash\"><pre class=\"language-bash\"><code class=\"language-bash\">$ aws emr cancel-steps <span class=\"token punctuation\">..</span>.</code></pre></div>\n<p>Spark 작업이 주기적으로 실행되어야 한다면,\n가장 간단한 방법은 위의 EMR step 등록 스크립트를 crontab으로 등록하는 것 입니다.\n만약 작업이 다양하고 복잡하다면, <strong>AWS Data Pipeline</strong> 이라는 제품을 고려해보는 것도 방법입니다.\n<a href=\"https://aws.amazon.com/ko/datapipeline/details/\">https://aws.amazon.com/ko/datapipeline/details/</a></p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html\">http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-submit-step.html</a></li>\n<li><a href=\"http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html\">http://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-work-with-steps.html</a></li>\n</ul>\n<br>","excerpt":"AWS EMR은 특정 작업을 등록할 수 있는 step 이라는 기능을 제공합니다.\n예를 들어 매일 새벽에 클러스터에서 돌려야하는 Batch…"}}},{"id":"b5ed5b3e-6945-502c-ab66-74d5ac1c4eba","title":"Spark의 Random Sampling에 대하여","slug":"spark-sampling","publishDate":"June 20, 2017","publishDateISO":"2017-06-20","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark에서 랜덤 샘플링을 하는 방법에 대해 정리해보았습니다.</p>\n<br>\n<h2 id=\"sample\" style=\"position:relative;\"><a href=\"#sample\" aria-label=\"sample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Sample()</h2>\n<p>Spark RDD API 에는 다양한 sampling 메서드가 존재합니다.\n그 중에서 가장 기본이 되는 <code class=\"language-text\">sample()</code>에 대해 먼저 알아보겠습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># sample(boolean withReplacement, double fraction, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">10000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>sample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">0.1</span><span class=\"token punctuation\">,</span> <span class=\"token number\">0</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>count</code></pre></div>\n<p>첫 번째 인자는 추출 방식을 결정합니다. <strong>True면 복원추출, False면 비복원추출</strong> 을 실행합니다.\n여기에서 말하는 복원추출이란, 한 번 뽑은 것을 다시 뽑을 수 있게 하는 방법을 말합니다.\n세 번째 인자로 시드 변수를 지정할 수 있습니다.\n시드란, 컴퓨터가 난수를 일정하게 생성하지 않도록 변화를 주는 값을 말합니다.</p>\n<br>\n<h2 id=\"takesample\" style=\"position:relative;\"><a href=\"#takesample\" aria-label=\"takesample permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>takeSample()</h2>\n<p>takeSample()도 랜덤 샘플링을 지원하는 메서드지만, 위와 조금 다른 점이 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token comment\"># takeSample(boolean withReplacement, int num, long seed)</span>\nval rdd <span class=\"token operator\">=</span> sc<span class=\"token punctuation\">.</span>parallelize<span class=\"token punctuation\">(</span><span class=\"token number\">1</span> to <span class=\"token number\">1000</span><span class=\"token punctuation\">,</span> <span class=\"token number\">3</span><span class=\"token punctuation\">)</span>\nrdd<span class=\"token punctuation\">.</span>takeSample<span class=\"token punctuation\">(</span>false<span class=\"token punctuation\">,</span> <span class=\"token number\">100</span><span class=\"token punctuation\">,</span> <span class=\"token number\">1</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p><code class=\"language-text\">takeSample()</code>은 두 번째 인자를 지정하여 몇 개를 추출할 것인지 정할 수 있습니다.\n하지만, 결과 값이 RDD가 아닌 리스트나 배열이기 때문에 <strong>메모리에 주의</strong> 해야 합니다.\n정리하자면, 크기를 정해놓고 샘플을 추출하고자 한다면 takeSample() 메서드가 적합하고\n메모리를 생각해서 작은 값을 추출할 때 사용하는 것이 좋습니다.</p>\n<p>이외에도 <code class=\"language-text\">sampleByKey, sampleByKeyExtract</code> 메서드가 존재합니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html\">https://spark.apache.org/docs/1.6.2/api/java/org/apache/spark/rdd/RDD.html</a></li>\n</ul>\n<br>","excerpt":"데이터를 분석하다보면 임의의 샘플을 추출해야 하는 상황이 생깁니다.\n그래서 이번에는 Spark…"}}},{"id":"a6401b01-05d6-5899-8c9b-4984720e0f66","title":"Spark의 Temporary View에 대하여","slug":"spark-temp-view","publishDate":"June 16, 2017","publishDateISO":"2017-06-16","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":2,"html":"<p>SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.0 부터 생긴 <code class=\"language-text\">Spark Global Temporary View</code>와\n기존의 <code class=\"language-text\">TempView</code>가 어떤 차이가 있는지 그리고 어떻게 사용해야하는지 알아보곘습니다.</p>\n<br>\n<h2 id=\"spark-temporary-view\" style=\"position:relative;\"><a href=\"#spark-temporary-view\" aria-label=\"spark temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Spark Temporary View</h2>\n<p>공식문서를 보면 Spark의 Temporary View는 Session-Scope 입니다.\n무슨 말이냐 하면, View의 생명주기가 세션에 달려있다는 뜻 입니다.\n(여기에서 말하는 세션은 SparkSession 입니다)\n그리고, 세션이 종료되면 자동으로 View 테이블이 Drop 됩니다.</p>\n<br>\n<h2 id=\"createorreplacetempview\" style=\"position:relative;\"><a href=\"#createorreplacetempview\" aria-label=\"createorreplacetempview permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>CreateOrReplaceTempView</h2>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df <span class=\"token operator\">=</span> spark<span class=\"token punctuation\">.</span>sql<span class=\"token punctuation\">(</span>query<span class=\"token punctuation\">)</span><span class=\"token punctuation\">.</span>cache<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">print</span> df<span class=\"token punctuation\">.</span>count<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>CreateOrReplaceTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>dropTempView<span class=\"token punctuation\">(</span><span class=\"token string\">\"TempView\"</span><span class=\"token punctuation\">)</span>\ndf<span class=\"token punctuation\">.</span>unpersist<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>먼저 기존에 사용하던 TempView를 보겠습니다.\n위의 예시는 PySpark 코드입니다.\n세 번째 줄의 <code class=\"language-text\">createOrReplaceTempView</code>가 View를 생성하는 함수인데,\nSpark은 Lazy evaluation이기 때문에 아직 실행 되기 이전 입니다.\n이후 두 번째 줄에서 count() 함수를 실행하면 생성되며,\nTempView라는 이름으로 메모리에 두고 사용할 수 있게 됩니다.\n다 사용한 다음에는 꼭 <code class=\"language-text\">unpersist</code> 함수로 할당된 메모리를 해제시켜줘야 합니다.</p>\n<p>위와 다르게 Temp View에 대한 명령만 내리고 마지막에 한번에 처리해도 되지만,\n여러 개로 쪼개서 명령을 내리는 것이 상대적으로 빠르다고 합니다.</p>\n<br>\n<h2 id=\"global-temporary-view\" style=\"position:relative;\"><a href=\"#global-temporary-view\" aria-label=\"global temporary view permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Global Temporary View</h2>\n<div class=\"gatsby-highlight\" data-language=\"sql\"><pre class=\"language-sql\"><code class=\"language-sql\"><span class=\"token keyword\">CREATE</span> <span class=\"token keyword\">GLOBAL</span> <span class=\"token keyword\">TEMPORARY</span> <span class=\"token keyword\">VIEW</span> temp_view <span class=\"token keyword\">AS</span> <span class=\"token keyword\">SELECT</span> a<span class=\"token punctuation\">,</span> b <span class=\"token keyword\">FROM</span> tbl\n<span class=\"token keyword\">SELECT</span> <span class=\"token operator\">*</span> <span class=\"token keyword\">FROM</span> global_temp<span class=\"token punctuation\">.</span>temp_view\n<span class=\"token keyword\">DROP</span> <span class=\"token keyword\">VIEW</span> global_temp<span class=\"token punctuation\">.</span>temp_view</code></pre></div>\n<p>위의 예시는 Spark SQL 코드입니다.\nGlobal Temporary View는 Spark 2.1.0에서 처음 소개되었으며, <code class=\"language-text\">GLOBAL TEMPORARY VIEW</code> 라는 키워드로 생성합니다.\n그렇게 선언하고 나면 일종의 임시 테이블로 접근할 수 있습니다.\n삭제할 때는 <code class=\"language-text\">DROP VIEW</code> 라는 키워드로 삭제합니다.</p>\n<p>하지만 Global Temporary View는 조금 위험합니다.\n이 View는 말 그대로 전역적인 상태로 남기 위해 시스템의 임시 데이터베이스로 연결됩니다.\n그래서 접근할 때, <code class=\"language-text\">global_temp</code>로 접근하게 됩니다.</p>\n<p>결론부터 말하자면 Global Temporary View는 모든 세션에서 공유 가능하며,\nSpark 어플리케이션이 종료되기 전까지 살아있게 됩니다.\n제 경우 Master 노드의 하드디스크에 저장되어 있었습니다.\n이렇게 되면 일단 IO로 인해 로딩속도가 상당히 느려지고,\n만일 View의 크기가 메모리 용량을 넘어갔더라면 Master가 내려갈 수도 있는 상황입니다.\n이와 같은 이유로 Global Temporary View는 신중히 사용하는 것이 좋습니다.</p>\n<br>\n<h2 id=\"reference\" style=\"position:relative;\"><a href=\"#reference\" aria-label=\"reference permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Reference</h2>\n<ul>\n<li><a href=\"https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html\">https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/sql/catalog/Catalog.html</a></li>\n<li><a href=\"https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view\">https://spark.apache.org/docs/latest/sql-programming-guide.html#global-temporary-view</a></li>\n</ul>\n<br>","excerpt":"SQL의 View 처럼 Spark에서도 View를 지원합니다.\n이 포스팅에서는 Spark 2.1.…"}}},{"id":"99925524-39d0-5943-982f-79148d6dbe29","title":"Pandas DataFrame을 병렬처리 하는 방법","slug":"pandas-parallel","publishDate":"February 27, 2017","publishDateISO":"2017-02-27","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas는 여전히 내부적으로 병렬처리 기능을 지원하지 않습니다.</p>\n<p>하지만, 큰 규모의 DataFrame을 돌리다보면 전처리에도 시간이 많이 걸리게 됩니다.\n그런 경우에 병렬처리를 통해 속도를 개선할 수 있습니다.</p>\n<p>이 포스팅에서는 가장 간단한 CPU 프로세스 병렬처리를 다루도록 하겠습니다. 방법은 간단합니다.\n거대한 DataFrame을 CPU 코어 수 만큼 분할하고, 전처리 기능을 수행한 다음 다시 합치면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">import</span> numpy <span class=\"token keyword\">as</span> np\n<span class=\"token keyword\">import</span> seaborn <span class=\"token keyword\">as</span> sns\n<span class=\"token keyword\">from</span> multiprocessing <span class=\"token keyword\">import</span> Pool\n\nnum_cores <span class=\"token operator\">=</span> <span class=\"token number\">4</span>\niris <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>DataFrame<span class=\"token punctuation\">(</span>sns<span class=\"token punctuation\">.</span>load_dataset<span class=\"token punctuation\">(</span><span class=\"token string\">'iris'</span><span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span></code></pre></div>\n<p>예시로 iris 데이터를 사용하겠습니다.\ncpu 코어의 수는 <code class=\"language-text\">multiprocessing.cpu_count()</code> 함수를 통해서 얻으실 수 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">parallelize_dataframe</span><span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> func<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    df_split <span class=\"token operator\">=</span> np<span class=\"token punctuation\">.</span>array_split<span class=\"token punctuation\">(</span>df<span class=\"token punctuation\">,</span> num_cores<span class=\"token punctuation\">)</span>\n    pool <span class=\"token operator\">=</span> Pool<span class=\"token punctuation\">(</span>num_cores<span class=\"token punctuation\">)</span>\n    df <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>concat<span class=\"token punctuation\">(</span>pool<span class=\"token punctuation\">.</span><span class=\"token builtin\">map</span><span class=\"token punctuation\">(</span>func<span class=\"token punctuation\">,</span> df_split<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>close<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    pool<span class=\"token punctuation\">.</span>join<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> df</code></pre></div>\n<p>parallelize_dataframe은 어떤 전처리 함수가 들어왔을 때 CPU 병렬처리를 도와주는 함수입니다.\nmultiprocessing.Pool을 이용하여 분할된 DataFrame에 함수를 적용시키고,\npd.concat()으로 다시 합치는 과정입니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">def</span> <span class=\"token function\">multiply_columns</span><span class=\"token punctuation\">(</span>data<span class=\"token punctuation\">)</span><span class=\"token punctuation\">:</span>\n    data<span class=\"token punctuation\">[</span><span class=\"token string\">'length_of_word'</span><span class=\"token punctuation\">]</span> <span class=\"token operator\">=</span> data<span class=\"token punctuation\">[</span><span class=\"token string\">'species'</span><span class=\"token punctuation\">]</span><span class=\"token punctuation\">.</span><span class=\"token builtin\">apply</span><span class=\"token punctuation\">(</span><span class=\"token keyword\">lambda</span> x<span class=\"token punctuation\">:</span> <span class=\"token builtin\">len</span><span class=\"token punctuation\">(</span>x<span class=\"token punctuation\">)</span><span class=\"token punctuation\">)</span>\n    <span class=\"token keyword\">return</span> data</code></pre></div>\n<p>각 종 이름의 글자 수를 세는 전처리 함수를 예로 들어 속도차이를 확인해보겠습니다.\n결과는 아래와 같습니다.</p>\n<br>\n<p><img src=\"/assets/images/pandas-parallel.png\" alt=\"pandas-parrallel\"></p>\n<p>다른 방법으로 Pandas의 engine에 Dask를 사용하는 방법도 있습니다.\n<a href=\"http://dask.readthedocs.io/en/latest/\">http://dask.readthedocs.io/en/latest/</a></p>","excerpt":"Scikit-learn의 모델들은 cython과 joblib으로 최적화 및 자동 병렬처리 되도록 설계되어 있지만,\nPandas…"}}},{"id":"7b5cb907-431b-543e-8953-1ad33cf6b88e","title":"Pandas DataFrame을 MySQL에 저장하는 방법","slug":"dataframe-to-mysql","publishDate":"February 26, 2017","publishDateISO":"2017-02-26","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬3에서는 <code class=\"language-text\">MySQLdb</code>를 지원하지 않기 때문에, <code class=\"language-text\">pymysql</code>로 불러와야 합니다.\n꼭 pymysql이 아니어도 상관없지만, 사용해보면 <code class=\"language-text\">mysql-connector</code> 보다 빠르다는걸 체감할 수 있습니다. 먼저, 필요한 패키지를 설치해줍니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<h2 id=\"sqlalchemy-pymysql-mysqldb\" style=\"position:relative;\"><a href=\"#sqlalchemy-pymysql-mysqldb\" aria-label=\"sqlalchemy pymysql mysqldb permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>SQLAlchemy, pymysql, MySQLdb</h2>\n<p><code class=\"language-text\">install_as_MySQLdb()</code> 함수를 통해 MySQLdb와 호환 가능합니다.\n이제 sqlalchemy를 통해 DB에 연결할 수 있습니다.\n주소에서 root, password는 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\n<span class=\"token comment\"># MySQL Connector using pymysql</span>\npymysql<span class=\"token punctuation\">.</span>install_as_MySQLdb<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span>\n<span class=\"token keyword\">import</span> MySQLdb\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">\"mysql+mysqldb://root:\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"password\"</span><span class=\"token operator\">+</span><span class=\"token string\">\"@localhost/db_name\"</span><span class=\"token punctuation\">,</span> encoding<span class=\"token operator\">=</span><span class=\"token string\">'utf-8'</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql에-저장하기\" style=\"position:relative;\"><a href=\"#mysql%EC%97%90-%EC%A0%80%EC%9E%A5%ED%95%98%EA%B8%B0\" aria-label=\"mysql에 저장하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL에 저장하기</h2>\n<p>이제 DataFrame을 MySQL에 테이블 형태로 저장할 차례입니다.\n아래와 같이 pandas의 <code class=\"language-text\">to_sql()</code> 함수를 사용하여 저장하면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">df<span class=\"token punctuation\">.</span>to_sql<span class=\"token punctuation\">(</span>name<span class=\"token operator\">=</span>table<span class=\"token punctuation\">,</span> con<span class=\"token operator\">=</span>engine<span class=\"token punctuation\">,</span> if_exists<span class=\"token operator\">=</span><span class=\"token string\">'append'</span><span class=\"token punctuation\">)</span>\npython\n\n자주 사용할 수 있으니 함수로 따로 설정해주면 편합니다<span class=\"token punctuation\">.</span></code></pre></div>","excerpt":"Pandas DataFrame을 MySQL에 저장하기 위해 먼저 커넥터가 필요합니다.\n파이썬…"}}},{"id":"79c1215f-bb79-5e21-b334-04fb090a7956","title":"Jupyter Notebook 외부접속 설정하기","slug":"jupyter-config","publishDate":"February 12, 2017","publishDateISO":"2017-02-12","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>이번 포스팅에서는 Jupyter Notebook을 환경구축하고 난 이후에 외부접속을 설정하는 과정에 대해 알아보겠습니다. 환경구축하는 방법에 대해서는 이전의 포스팅 <a href=\"https://swalloow.github.io/jupyter-notebook-kernel\">https://swalloow.github.io/jupyter-notebook-kernel</a> 을 참고해주시기 바랍니다.</p>\n<br>\n<h2 id=\"외부접속-허용하기\" style=\"position:relative;\"><a href=\"#%EC%99%B8%EB%B6%80%EC%A0%91%EC%86%8D-%ED%97%88%EC%9A%A9%ED%95%98%EA%B8%B0\" aria-label=\"외부접속 허용하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>외부접속 허용하기</h2>\n<p>우선 <code class=\"language-text\">~/.jupyter/jupyter_notebook_config.py</code> 에 있는 Jupyter Notebook의 설정파일을 열어줍니다. 아마 모두 주석이 걸려있을텐데 필요한 부분만 수정해주시면 됩니다.</p>\n<ul>\n<li>실행경로 변경 : <code class=\"language-text\">c.NotebookApp.default_url = '/tree'</code></li>\n<li>외부접속 허용 : <code class=\"language-text\">c.NotebookApp.ip = '0.0.0.0'</code></li>\n<li>포트변경: <code class=\"language-text\">c.NotebookApp.port = 8888</code></li>\n</ul>\n<br>\n<h2 id=\"비밀번호-설정하기\" style=\"position:relative;\"><a href=\"#%EB%B9%84%EB%B0%80%EB%B2%88%ED%98%B8-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0\" aria-label=\"비밀번호 설정하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>비밀번호 설정하기</h2>\n<p>비밀번호를 설정하면 url에 접속했을 때, 암호를 입력하는 화면이 나타나게 됩니다. Jupyter Notebook에서는 HASH 값을 통해 암호화된 비밀번호를 적용할 수 있습니다.</p>\n<p>먼저, 새로운 노트를 생성하고 다음의 스크립트를 작성합니다. 암호를 설정하는 칸이 나오고 결과 값이 주어지면 그대로 복사해서 <code class=\"language-text\">c.NotebookApp.password = u''</code> 여기에 붙여넣기 하시면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">from</span> notebook<span class=\"token punctuation\">.</span>auth <span class=\"token keyword\">import</span> passwd<span class=\"token punctuation\">;</span>\npasswd<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>","excerpt":"이번 포스팅에서는 Jupyter Notebook…"}}},{"id":"ea6cffe1-0590-587f-975e-f196ce841ed7","title":"DB 테이블을 DataFrame으로 읽어오는 방법","slug":"db-to-dataframe","publishDate":"January 14, 2017","publishDateISO":"2017-01-14","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":1,"html":"<p>본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL 뿐만 아니라 모든 데이터베이스에 적용가능합니다.</p>\n<p>먼저 sqlalchemy가 설치되어 있지 않다면 설치해줍니다.\nsqlalchemy와 mysql을 연결하는 패키지가 필요합니다.</p>\n<p>파이썬2를 사용한다면 <code class=\"language-text\">mysql-python</code>, 3을 사용한다면 <code class=\"language-text\">pymysql</code>을 설치해주면 됩니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># python2\n$ pip install mysql-python\n$ pip install sqlalchemy\n\n# python3\n$ pip install pymysql\n$ pip install sqlalchemy</code></pre></div>\n<br>\n<p>이제 sqlalchemy를 통해 DB에 연결해보겠습니다.\n주소에서 root, password, table은 DB에 맞게 변경해야 합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\"><span class=\"token keyword\">import</span> pandas <span class=\"token keyword\">as</span> pd\n<span class=\"token keyword\">from</span> sqlalchemy <span class=\"token keyword\">import</span> create_engine\n\nengine <span class=\"token operator\">=</span> create_engine<span class=\"token punctuation\">(</span><span class=\"token string\">'mysql://root:password@localhost/table'</span><span class=\"token punctuation\">,</span> convert_unicode<span class=\"token operator\">=</span><span class=\"token boolean\">True</span><span class=\"token punctuation\">)</span>\nconn <span class=\"token operator\">=</span> engine<span class=\"token punctuation\">.</span>connect<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<p>마지막으로 pandas를 통해 table을 읽어들일 차례입니다.\npandas의 <code class=\"language-text\">read_sql()</code> 은 0.19 버전부터 생겨났으며, sqlalchemy를 필수로 사용하도록 되어 있습니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"python\"><pre class=\"language-python\"><code class=\"language-python\">data <span class=\"token operator\">=</span> pd<span class=\"token punctuation\">.</span>read_sql_table<span class=\"token punctuation\">(</span><span class=\"token string\">'table_name'</span><span class=\"token punctuation\">,</span> conn<span class=\"token punctuation\">)</span>\ndata<span class=\"token punctuation\">.</span>head<span class=\"token punctuation\">(</span><span class=\"token punctuation\">)</span></code></pre></div>\n<br>\n<h2 id=\"mysql-dump-파일을-읽어오는-방법\" style=\"position:relative;\"><a href=\"#mysql-dump-%ED%8C%8C%EC%9D%BC%EC%9D%84-%EC%9D%BD%EC%96%B4%EC%98%A4%EB%8A%94-%EB%B0%A9%EB%B2%95\" aria-label=\"mysql dump 파일을 읽어오는 방법 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>MySQL dump 파일을 읽어오는 방법</h2>\n<p>추가로 외부로부터 데이터를 넘겨받을 때 DB dump 파일 (.sql) 을 넘겨받는 경우가 있습니다.\n데이터베이스 전체를 받은 dump 파일이라면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database > data.sql</code></pre></div>\n<br>\n<p>특정 테이블만 받고 싶다면, 커멘드에 다음과 같이 입력합니다.</p>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># root, table, database, data.sql은 알아서 수정\n$ mysqldump -u root -p database table > data.sql</code></pre></div>\n<br>\n<p>위와 같은 과정이 끝나면, 나의 MySQL 계정에 데이터가 저장된 것을 확인할 수 있습니다.\n이후에는 앞에서 설명한대로 pandas를 통해 DataFrame으로 변환하면 됩니다.</p>","excerpt":"본 포스팅에서는 예시를 MySQL로 들지만 sqlalchemy의 커넥터만 변경해주면,\nMySQL…"}}},{"id":"5b58d9b9-e77f-55a7-99ee-76786a0036f7","title":"Jupyter Notebook 다중커널 설정하기","slug":"jupyter-notebook-kernel","publishDate":"January 28, 2017","publishDateISO":"2017-01-28","heroImage":{"title":"cover-dataengineering","gatsbyImageData":{"images":{"sources":[{"srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&q=50&fm=webp 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&q=50&fm=webp 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&q=50&fm=webp 1600w","sizes":"(min-width: 1600px) 1600px, 100vw","type":"image/webp"}],"fallback":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg","srcSet":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&h=267&fl=progressive&q=50&fm=jpg 400w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&h=533&fl=progressive&q=50&fm=jpg 800w,\nhttps://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&h=1067&fl=progressive&q=50&fm=jpg 1600w","sizes":"(min-width: 1600px) 1600px, 100vw"}},"layout":"constrained","width":1800,"height":1200,"placeholder":{"fallback":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z"}},"ogimg":{"src":"https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1800&q=50"}},"body":{"childMarkdownRemark":{"timeToRead":5,"html":"<p>Jupyer Notebook은 웹 기반의 대화형 노트북 지원으로 수식, 표, 그림 등을 표현하기 쉬운 개발 환경입니다.\n코딩과 문서화(Markdown)까지 한 화면에서 가능하며 커널 확장을 통해 다양한 파이썬 버전 뿐만 아니라 여러 언어를 지원합니다.</p>\n<p>이제 파이썬을 처음 설치한다고 가정하고 맥 OS에서 간단하게 jupyter 환경설정하는 방법을 소개해드리고자 합니다.</p>\n<br>\n<h2 id=\"pyenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-pyenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 pyenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"3-pyenv-사용해보기\" style=\"position:relative;\"><a href=\"#3-pyenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"3 pyenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. pyenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv versions\nsystem (set by /Users/USERNAME/.pyenv/version)</code></pre></div>\n<br>\n<h3 id=\"4-pyenv-명령어-정리\" style=\"position:relative;\"><a href=\"#4-pyenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"4 pyenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. pyenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv install &lt;version>\n$ pyenv uninstall &lt;version>\n$ pyenv install -list\n$ pyenv shell &lt;version>\n$ pyenv activate &lt;environment>\n$ pyenv deactivate &lt;environment></code></pre></div>\n<br>\n<h2 id=\"pyenv-virtualenv-설치하기\" style=\"position:relative;\"><a href=\"#pyenv-virtualenv-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0\" aria-label=\"pyenv virtualenv 설치하기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>pyenv-virtualenv 설치하기</h2>\n<h3 id=\"1-homebrew를-통해-pyenv-virtualenv를-설치\" style=\"position:relative;\"><a href=\"#1-homebrew%EB%A5%BC-%ED%86%B5%ED%95%B4-pyenv-virtualenv%EB%A5%BC-%EC%84%A4%EC%B9%98\" aria-label=\"1 homebrew를 통해 pyenv virtualenv를 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. Homebrew를 통해 pyenv-virtualenv를 설치</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ brew install pyenv-virtualenv</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-init을-bashrc에-추가-zsh를-사용하는-경우-zshrc\" style=\"position:relative;\"><a href=\"#2-virtualenv-init%EC%9D%84-bashrc%EC%97%90-%EC%B6%94%EA%B0%80-zsh%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0-zshrc\" aria-label=\"2 virtualenv init을 bashrc에 추가 zsh를 사용하는 경우 zshrc permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv init을 ~/.bashrc에 추가 (zsh를 사용하는 경우 ~/.zshrc)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ echo 'eval \"$(pyenv virtualenv-init -)\"' >> ~/.bashrc</code></pre></div>\n<br>\n<h3 id=\"2-pyenv-virtualenv-사용해보기\" style=\"position:relative;\"><a href=\"#2-pyenv-virtualenv-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B4%EA%B8%B0\" aria-label=\"2 pyenv virtualenv 사용해보기 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. pyenv-virtualenv 사용해보기</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\"># pyenv virtualenv [python version] [myname]\n$ pyenv virtualenv 2.7.11 python2\n$ pyenv virtualenv 3.5.1 python3</code></pre></div>\n<br>\n<h3 id=\"2-virtualenv-명령어-정리\" style=\"position:relative;\"><a href=\"#2-virtualenv-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%A0%95%EB%A6%AC\" aria-label=\"2 virtualenv 명령어 정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. virtualenv 명령어 정리</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv virtualenv versions\n$ pyenv virtualenv [python version] [myname]\n$ pyenv shell [myname]</code></pre></div>\n<br>\n<h3 id=\"jupyter-notebook-설치\" style=\"position:relative;\"><a href=\"#jupyter-notebook-%EC%84%A4%EC%B9%98\" aria-label=\"jupyter notebook 설치 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>Jupyter Notebook 설치</h3>\n<p>이제 방금 설치했던 파이썬 2와 3 버전의 환경에 python, notebook, jupyter를 설치할 차례입니다.\n따라서 방금 설치한 환경을 각각 activate한 다음에 아래와 같은 명령어를 실행시켜야 합니다.</p>\n<br>\n<h3 id=\"1-pip-install-python2-python3-각각-실행\" style=\"position:relative;\"><a href=\"#1-pip-install-python2-python3-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"1 pip install python2 python3 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>1. pip install (python2, python3 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pip install ipython\n$ pip install notebook\n$ pip install jupyter</code></pre></div>\n<br>\n<h3 id=\"2-초기-jupyter-configuration-파일-생성-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#2-%EC%B4%88%EA%B8%B0-jupyter-configuration-%ED%8C%8C%EC%9D%BC-%EC%83%9D%EC%84%B1-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"2 초기 jupyter configuration 파일 생성 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>2. 초기 Jupyter configuration 파일 생성 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook --generate-config\nInstalled kernelspec python3 in /Users/username/Library/Jupyter/kernels/python3</code></pre></div>\n<br>\n<h3 id=\"3-생성된-jupyter_notebook_configpy-설정-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#3-%EC%83%9D%EC%84%B1%EB%90%9C-jupyter_notebook_configpy-%EC%84%A4%EC%A0%95-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"3 생성된 jupyter_notebook_configpy 설정 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>3. 생성된 jupyter_notebook_config.py 설정 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ vi /Users/username/Library/Jupyter/kernels/python3/jupyter_notebook_config.py\n\n$ c.NotebookApp.ip = '127.0.0.1'\n$ c.NotebookApp.open_browser = False\n$ c.NotebookApp.port = 8888\n$ c.NotebookApp.password = [SHA password]</code></pre></div>\n<br>\n<h3 id=\"4-ipykernel-설정-마찬가지로-각각-실행\" style=\"position:relative;\"><a href=\"#4-ipykernel-%EC%84%A4%EC%A0%95-%EB%A7%88%EC%B0%AC%EA%B0%80%EC%A7%80%EB%A1%9C-%EA%B0%81%EA%B0%81-%EC%8B%A4%ED%96%89\" aria-label=\"4 ipykernel 설정 마찬가지로 각각 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>4. ipykernel 설정 (마찬가지로 각각 실행)</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ pyenv shell python2\n$ python -m ipykernel install --user\nInstalled kernelspec python2 in /home/seen/.local/share/jupyter/kernels/python2</code></pre></div>\n<br>\n<h3 id=\"5-kerneljson-확인-원하는-경우에만-커스텀-설정\" style=\"position:relative;\"><a href=\"#5-kerneljson-%ED%99%95%EC%9D%B8-%EC%9B%90%ED%95%98%EB%8A%94-%EA%B2%BD%EC%9A%B0%EC%97%90%EB%A7%8C-%EC%BB%A4%EC%8A%A4%ED%85%80-%EC%84%A4%EC%A0%95\" aria-label=\"5 kerneljson 확인 원하는 경우에만 커스텀 설정 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>5. kernel.json 확인 (원하는 경우에만 커스텀 설정)</h3>\n<div class=\"gatsby-highlight\" data-language=\"json\"><pre class=\"language-json\"><code class=\"language-json\">$ vi /home/seen/.local/share/jupyter/kernels/python2/kernel.json\n<span class=\"token punctuation\">{</span>\n  <span class=\"token property\">\"display_name\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"Python 2\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"language\"</span><span class=\"token operator\">:</span> <span class=\"token string\">\"python\"</span><span class=\"token punctuation\">,</span>\n  <span class=\"token property\">\"argv\"</span><span class=\"token operator\">:</span> <span class=\"token punctuation\">[</span>\n    <span class=\"token string\">\"/home/seen/.pyenv/versions/py27/bin/python\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-m\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"ipykernel\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"-f\"</span><span class=\"token punctuation\">,</span>\n    <span class=\"token string\">\"{connection_file}\"</span>\n    <span class=\"token punctuation\">]</span>\n  <span class=\"token punctuation\">}</span>\n<span class=\"token punctuation\">}</span></code></pre></div>\n<br>\n<h3 id=\"6-jupyter-notebook을-실행\" style=\"position:relative;\"><a href=\"#6-jupyter-notebook%EC%9D%84-%EC%8B%A4%ED%96%89\" aria-label=\"6 jupyter notebook을 실행 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>6. jupyter notebook을 실행</h3>\n<div class=\"gatsby-highlight\" data-language=\"text\"><pre class=\"language-text\"><code class=\"language-text\">$ jupyter notebook\n\n# background running\n$ nohup jupyter notebook &amp;\n\n# kill process\n$ ps -a\n37788 ttys000 0:00:00 ...python (노트북을 실행한 프로세스)\n$ kill 37788</code></pre></div>\n<br>\n<h3 id=\"정리\" style=\"position:relative;\"><a href=\"#%EC%A0%95%EB%A6%AC\" aria-label=\"정리 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>정리</h3>\n<p>윈도우10 에서 아주 고생했던 환경설정이 맥 OS에서는 아주 간편하게 됩니다…\n잘 안되거나 오류가 생기시면 댓글로 알려주시면 감사하겠습니다!</p>\n<br>\n<h3 id=\"참고링크\" style=\"position:relative;\"><a href=\"#%EC%B0%B8%EA%B3%A0%EB%A7%81%ED%81%AC\" aria-label=\"참고링크 permalink\" class=\"anchor before\"><svg aria-hidden=\"true\" focusable=\"false\" height=\"16\" version=\"1.1\" viewBox=\"0 0 16 16\" width=\"16\"><path fill-rule=\"evenodd\" d=\"M4 9h1v1H4c-1.5 0-3-1.69-3-3.5S2.55 3 4 3h4c1.45 0 3 1.69 3 3.5 0 1.41-.91 2.72-2 3.25V8.59c.58-.45 1-1.27 1-2.09C10 5.22 8.98 4 8 4H4c-.98 0-2 1.22-2 2.5S3 9 4 9zm9-3h-1v1h1c1 0 2 1.22 2 2.5S13.98 12 13 12H9c-.98 0-2-1.22-2-2.5 0-.83.42-1.64 1-2.09V6.25c-1.09.53-2 1.84-2 3.25C6 11.31 7.55 13 9 13h4c1.45 0 3-1.69 3-3.5S14.5 6 13 6z\"></path></svg></a>참고링크</h3>\n<ul>\n<li><a href=\"https://github.com/yyuu/pyenv\">https://github.com/yyuu/pyenv</a></li>\n<li><a href=\"https://github.com/yyuu/pyenv-virtualenv\">https://github.com/yyuu/pyenv-virtualenv</a></li>\n</ul>","excerpt":"Jupyer Notebook…"}}}]}},"pageContext":{"slug":"dataengineering","basePath":"","paginationPath":"/tag/dataengineering","pageNumber":0,"humanPageNumber":1,"skip":0,"limit":6,"numberOfPages":7,"previousPagePath":"","nextPagePath":"/tag/dataengineering/2"}},"staticQueryHashes":["1946181227","2744905544","3732430097"]}
\ No newline at end of file
diff --git a/tag/dataengineering/index.html b/tag/dataengineering/index.html
index 476e67d..aac61d7 100644
--- a/tag/dataengineering/index.html
+++ b/tag/dataengineering/index.html
@@ -68,5 +68,5 @@
   var mode = localStorage.getItem('theme-ui-color-mode');
   if (!mode) return
   document.documentElement.classList.add('theme-ui-' + mode);
-} catch (e) {} })();</script><div id="___gatsby"><style data-emotion="css-global hms875">html{--theme-ui-colors-background:#ffffff;--theme-ui-colors-text:#121212;--theme-ui-colors-primary:#121212;--theme-ui-colors-secondary:#e9e9e9;--theme-ui-colors-tertiary:#f3f3f3;--theme-ui-colors-highlight:#5b8bf7;color:var(--theme-ui-colors-text);background-color:var(--theme-ui-colors-background);}</style><style data-emotion="css-global 0"></style><div style="outline:none" tabindex="-1" id="gatsby-focus-wrapper"><style data-emotion="css sg0hsn">.css-sg0hsn{font-family:'Noto Sans KR';}</style><div class="siteRoot css-sg0hsn er8jt8f1"><div class="siteContent"><style data-emotion="css 101lz6j">.css-101lz6j{font-family:'Noto Sans KR';padding:0 1rem;line-height:60px;background:#2867cf;color:white;z-index:101;position:fixed;top:-100%;}.css-101lz6j:hover{-webkit-text-decoration:underline;text-decoration:underline;}.css-101lz6j:focus,.css-101lz6j:active,.css-101lz6j:hover{top:0;}</style><a href="#main" id="skip-navigation" class="css-101lz6j er8jt8f0">Skip to content</a><style data-emotion="css 135rxfn">.css-135rxfn{background:var(--theme-ui-colors-primary);width:100%;padding:1.5em 0;}</style><header class="css-135rxfn e1vkxza51"><style data-emotion="css g3texn">.css-g3texn{width:100%;max-width:1050px;margin:0 auto;padding:0 1.5em;}.css-g3texn ul{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;}.css-g3texn li{display:inline-block;margin-left:1em;}.css-g3texn li:first-of-type{position:relative;margin:0;-webkit-flex-basis:100%;-ms-flex-preferred-size:100%;flex-basis:100%;}.css-g3texn a{-webkit-text-decoration:none;text-decoration:none;color:DarkGray;font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;border-bottom:2px solid var(--theme-ui-colors-text);}.css-g3texn a:hover{color:white;}</style><nav class="css-g3texn e1vkxza50"><ul><li><a href="/">Home</a></li><li><a href="/about/">About</a></li><li><a href="/feed.xml">Subscribe</a></li></ul></nav></header><div id="main"><style data-emotion="css 12q3pxa">.css-12q3pxa{margin:0 auto auto;width:100%;max-width:1050px;padding:3em 1.5em 2em;-webkit-box-flex:1;-webkit-flex-grow:1;-ms-flex-positive:1;flex-grow:1;}</style><section class="css-12q3pxa e16x2jx90"><style data-emotion="css 68ixl">.css-68ixl{font-size:2em;text-transform:capitalize;font-weight:600;text-align:center;margin:0 0 3rem 0;margin:1rem 0 4rem 0;line-height:1.2;}.css-68ixl span{margin:0 0 0 0.25em;}.css-68ixl a{-webkit-transition:all 0.2s;transition:all 0.2s;color:var(--theme-ui-colors-text);}.css-68ixl a:hover{color:var(--theme-ui-colors-highlight);}</style><h1 class="css-68ixl e1btjkuw0">42<!-- --> Posts Tagged: “<!-- -->DataEngineering<!-- -->”</h1><style data-emotion="css l26jln">.css-l26jln{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;margin:0 auto;}.css-l26jln::after{content:'';-webkit-flex:0 0 32%;-ms-flex:0 0 32%;flex:0 0 32%;}</style><ul class="css-l26jln edjm4kl0"><style data-emotion="css fmdkoe">.css-fmdkoe{position:relative;border:1px solid var(--theme-ui-colors-secondary);border-radius:2px;margin:0 0 1em;width:100%;-webkit-transition:background 0.2s;transition:background 0.2s;}@media screen and (min-width: 35em){.css-fmdkoe{-webkit-flex:0 0 49%;-ms-flex:0 0 49%;flex:0 0 49%;margin:0 0 2vw;}}@media screen and (min-width: 50em){.css-fmdkoe{-webkit-flex:0 0 32%;-ms-flex:0 0 32%;flex:0 0 32%;}}.css-fmdkoe:hover{background:var(--theme-ui-colors-tertiary);}.css-fmdkoe a{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:column;-webkit-flex-flow:column;-ms-flex-flow:column;flex-flow:column;height:100%;width:100%;color:var(--theme-ui-colors-text);-webkit-text-decoration:none;text-decoration:none;}.css-fmdkoe a .gatsby-image-wrapper{height:0;padding-bottom:60%;}@media screen and (min-width: 35em){.css-fmdkoe a .gatsby-image-wrapper{padding-bottom:60%;}}</style><li class="css-fmdkoe ew41f695"><a href="/llm-dataplatform/"><style data-emotion="css 1s0ao55">.css-1s0ao55{border-top-left-radius:1px;border-top-right-radius:1px;}</style><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><style data-emotion="css tmzo0n">.css-tmzo0n{font-size:1.5em;font-weight:600;line-height:1.3;text-transform:capitalize;margin:1rem 1rem 0.5rem;}</style><h2 class="css-tmzo0n ew41f693">AI를 통해 진화하는 데이터플랫폼 근황</h2><style data-emotion="css w9bdb">.css-w9bdb{margin:0 1rem 0.5rem;color:gray;}</style><h3 class="css-w9bdb ew41f692">January 21, 2024</h3><style data-emotion="css 1gf1qw8">.css-1gf1qw8{margin:0 1rem 1.5rem;color:gray;}</style><h4 class="css-1gf1qw8 ew41f691">4<!-- --> min read</h4><style data-emotion="css qdaqqm">.css-qdaqqm{margin:0 1rem 1rem;line-height:1.6;}</style><p class="css-qdaqqm ew41f690">생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
+} catch (e) {} })();</script><div id="___gatsby"><style data-emotion="css-global hms875">html{--theme-ui-colors-background:#ffffff;--theme-ui-colors-text:#121212;--theme-ui-colors-primary:#121212;--theme-ui-colors-secondary:#e9e9e9;--theme-ui-colors-tertiary:#f3f3f3;--theme-ui-colors-highlight:#5b8bf7;color:var(--theme-ui-colors-text);background-color:var(--theme-ui-colors-background);}</style><style data-emotion="css-global 0"></style><div style="outline:none" tabindex="-1" id="gatsby-focus-wrapper"><style data-emotion="css sg0hsn">.css-sg0hsn{font-family:'Noto Sans KR';}</style><div class="siteRoot css-sg0hsn er8jt8f1"><div class="siteContent"><style data-emotion="css 101lz6j">.css-101lz6j{font-family:'Noto Sans KR';padding:0 1rem;line-height:60px;background:#2867cf;color:white;z-index:101;position:fixed;top:-100%;}.css-101lz6j:hover{-webkit-text-decoration:underline;text-decoration:underline;}.css-101lz6j:focus,.css-101lz6j:active,.css-101lz6j:hover{top:0;}</style><a href="#main" id="skip-navigation" class="css-101lz6j er8jt8f0">Skip to content</a><style data-emotion="css 135rxfn">.css-135rxfn{background:var(--theme-ui-colors-primary);width:100%;padding:1.5em 0;}</style><header class="css-135rxfn e1vkxza51"><style data-emotion="css g3texn">.css-g3texn{width:100%;max-width:1050px;margin:0 auto;padding:0 1.5em;}.css-g3texn ul{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;}.css-g3texn li{display:inline-block;margin-left:1em;}.css-g3texn li:first-of-type{position:relative;margin:0;-webkit-flex-basis:100%;-ms-flex-preferred-size:100%;flex-basis:100%;}.css-g3texn a{-webkit-text-decoration:none;text-decoration:none;color:DarkGray;font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;border-bottom:2px solid var(--theme-ui-colors-text);}.css-g3texn a:hover{color:white;}</style><nav class="css-g3texn e1vkxza50"><ul><li><a href="/">Home</a></li><li><a href="/about/">About</a></li><li><a href="/feed.xml">Subscribe</a></li></ul></nav></header><div id="main"><style data-emotion="css 12q3pxa">.css-12q3pxa{margin:0 auto auto;width:100%;max-width:1050px;padding:3em 1.5em 2em;-webkit-box-flex:1;-webkit-flex-grow:1;-ms-flex-positive:1;flex-grow:1;}</style><section class="css-12q3pxa e16x2jx90"><style data-emotion="css 68ixl">.css-68ixl{font-size:2em;text-transform:capitalize;font-weight:600;text-align:center;margin:0 0 3rem 0;margin:1rem 0 4rem 0;line-height:1.2;}.css-68ixl span{margin:0 0 0 0.25em;}.css-68ixl a{-webkit-transition:all 0.2s;transition:all 0.2s;color:var(--theme-ui-colors-text);}.css-68ixl a:hover{color:var(--theme-ui-colors-highlight);}</style><h1 class="css-68ixl e1btjkuw0">42<!-- --> Posts Tagged: “<!-- -->DataEngineering<!-- -->”</h1><style data-emotion="css l26jln">.css-l26jln{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;margin:0 auto;}.css-l26jln::after{content:'';-webkit-flex:0 0 32%;-ms-flex:0 0 32%;flex:0 0 32%;}</style><ul class="css-l26jln edjm4kl0"><style data-emotion="css fmdkoe">.css-fmdkoe{position:relative;border:1px solid var(--theme-ui-colors-secondary);border-radius:2px;margin:0 0 1em;width:100%;-webkit-transition:background 0.2s;transition:background 0.2s;}@media screen and (min-width: 35em){.css-fmdkoe{-webkit-flex:0 0 49%;-ms-flex:0 0 49%;flex:0 0 49%;margin:0 0 2vw;}}@media screen and (min-width: 50em){.css-fmdkoe{-webkit-flex:0 0 32%;-ms-flex:0 0 32%;flex:0 0 32%;}}.css-fmdkoe:hover{background:var(--theme-ui-colors-tertiary);}.css-fmdkoe a{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:column;-webkit-flex-flow:column;-ms-flex-flow:column;flex-flow:column;height:100%;width:100%;color:var(--theme-ui-colors-text);-webkit-text-decoration:none;text-decoration:none;}.css-fmdkoe a .gatsby-image-wrapper{height:0;padding-bottom:60%;}@media screen and (min-width: 35em){.css-fmdkoe a .gatsby-image-wrapper{padding-bottom:60%;}}</style><li class="css-fmdkoe ew41f695"><a href="/llm-dataplatform/"><style data-emotion="css 1s0ao55">.css-1s0ao55{border-top-left-radius:1px;border-top-right-radius:1px;}</style><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><style data-emotion="css tmzo0n">.css-tmzo0n{font-size:1.5em;font-weight:600;line-height:1.3;text-transform:capitalize;margin:1rem 1rem 0.5rem;}</style><h2 class="css-tmzo0n ew41f693">AI를 통해 변화하는 데이터플랫폼 근황</h2><style data-emotion="css w9bdb">.css-w9bdb{margin:0 1rem 0.5rem;color:gray;}</style><h3 class="css-w9bdb ew41f692">January 21, 2024</h3><style data-emotion="css 1gf1qw8">.css-1gf1qw8{margin:0 1rem 1.5rem;color:gray;}</style><h4 class="css-1gf1qw8 ew41f691">4<!-- --> min read</h4><style data-emotion="css qdaqqm">.css-qdaqqm{margin:0 1rem 1rem;line-height:1.6;}</style><p class="css-qdaqqm ew41f690">생성형 AI의 공개 이후 다양한 영역에서 활용하는 사례가 늘어나고 있습니다.
 오늘은 데이터플랫폼 영역에서 AI…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/pandas-2-0-copy-on-write/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Pandas 2.0의 Copy-on-Write에 대하여</h2><h3 class="css-w9bdb ew41f692">December 24, 2023</h3><h4 class="css-1gf1qw8 ew41f691">7<!-- --> min read</h4><p class="css-qdaqqm ew41f690">Pandas 2.0 버전부터 가 추가되었으며 3.0 버전부터 기본 값이 활성화로 변경됩니다. 이번 글에서는 Pandas Copy-on-Write…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/spark-on-kubernetes-scheduler-2/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Spark on Kubernetes: 커스텀 스케줄러 (2)</h2><h3 class="css-w9bdb ew41f692">December 10, 2023</h3><h4 class="css-1gf1qw8 ew41f691">5<!-- --> min read</h4><p class="css-qdaqqm ew41f690">Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/spark-on-kubernetes-scheduler/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Spark on Kubernetes: 커스텀 스케줄러 (1)</h2><h3 class="css-w9bdb ew41f692">June 08, 2023</h3><h4 class="css-1gf1qw8 ew41f691">3<!-- --> min read</h4><p class="css-qdaqqm ew41f690">Spark 3.4 버전부터 Customized K8S Scheduler 기능이 GA…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/spark-on-kubernetes-spot-instance/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Spark on Kubernetes: 스팟 인스턴스 사용을 위한 기능들</h2><h3 class="css-w9bdb ew41f692">July 23, 2022</h3><h4 class="css-1gf1qw8 ew41f691">3<!-- --> min read</h4><p class="css-qdaqqm ew41f690">스팟 인스턴스 유형을 사용하면 온디맨드에 비해 70~9…</p></a></li><li class="css-fmdkoe ew41f695"><a href="/airflow-worker-keda-autoscaler/"><div data-gatsby-image-wrapper="" style="background-color:#eeeeee" class="gatsby-image-wrapper gatsby-image-wrapper-constrained css-1s0ao55 ew41f694"><div style="max-width:1800px;display:block"><img alt="" role="presentation" aria-hidden="true" src="data:image/svg+xml;charset=utf-8,%3Csvg height=&#x27;1200&#x27; width=&#x27;1800&#x27; xmlns=&#x27;http://www.w3.org/2000/svg&#x27; version=&#x27;1.1&#x27;%3E%3C/svg%3E" style="max-width:100%;display:block;position:static"/></div><img aria-hidden="true" data-placeholder-image="" style="opacity:1;transition:opacity 500ms linear" decoding="async" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAlgCWAAD/2wBDABALDA4MChAODQ4SERATGCgaGBYWGDEjJR0oOjM9PDkzODdASFxOQERXRTc4UG1RV19iZ2hnPk1xeXBkeFxlZ2P/2wBDARESEhgVGC8aGi9jQjhCY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2NjY2P/wAARCAANABQDASIAAhEBAxEB/8QAGAAAAgMAAAAAAAAAAAAAAAAAAAMBAgb/xAAcEAACAgMBAQAAAAAAAAAAAAAAAQIREiExYeH/xAAWAQEBAQAAAAAAAAAAAAAAAAABAgP/xAAUEQEAAAAAAAAAAAAAAAAAAAAA/9oADAMBAAIRAxEAPwDK1DF0vgtxW9EylQu8nTotmo+gHfAEP//Z" alt=""/><picture><source type="image/webp" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" data-src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" data-srcset="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture><noscript><picture><source type="image/webp" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;q=50&amp;fm=webp 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;q=50&amp;fm=webp 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;q=50&amp;fm=webp 1600w" sizes="(min-width: 1600px) 1600px, 100vw"/><img data-gatsby-image-ssr="" data-main-image="" style="background-color:#eeeeee;opacity:0" sizes="(min-width: 1600px) 1600px, 100vw" decoding="async" loading="lazy" src="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg" srcSet="https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=400&amp;h=267&amp;fl=progressive&amp;q=50&amp;fm=jpg 400w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=800&amp;h=533&amp;fl=progressive&amp;q=50&amp;fm=jpg 800w,https://images.ctfassets.net/tushy4jlcik7/7uo9TsqFN9EBsDBqDJ5vXl/4c58a9f94babb15d8fd996c247737656/cover_dataengineering.jpg?w=1600&amp;h=1067&amp;fl=progressive&amp;q=50&amp;fm=jpg 1600w" alt="cover-dataengineering"/></picture></noscript><script type="module">const t="undefined"!=typeof HTMLImageElement&&"loading"in HTMLImageElement.prototype;if(t){const t=document.querySelectorAll("img[data-main-image]");for(let e of t){e.dataset.src&&(e.setAttribute("src",e.dataset.src),e.removeAttribute("data-src")),e.dataset.srcset&&(e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset"));const t=e.parentNode.querySelectorAll("source[data-srcset]");for(let e of t)e.setAttribute("srcset",e.dataset.srcset),e.removeAttribute("data-srcset");e.complete&&(e.style.opacity=1,e.parentNode.parentNode.querySelector("[data-placeholder-image]").style.opacity=0)}}</script></div><h2 class="css-tmzo0n ew41f693">Airflow worker에 KEDA AutoScaler 적용한 후기</h2><h3 class="css-w9bdb ew41f692">June 24, 2022</h3><h4 class="css-1gf1qw8 ew41f691">4<!-- --> min read</h4><p class="css-qdaqqm ew41f690">Airflow…</p></a></li></ul></section><style data-emotion="css 122up9l">.css-122up9l{width:100%;margin:-1.5rem auto 2.5rem;max-width:1050px;padding:0 1.5rem;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;-webkit-align-items:baseline;-webkit-box-align:baseline;-ms-flex-align:baseline;align-items:baseline;}</style><div class="css-122up9l er8hy5f3"><style data-emotion="css 18kuraq">.css-18kuraq{border:1px solid var(--theme-ui-colors-secondary);border-radius:2px;display:inline-block;float:left;color:var(--theme-ui-colors-text);padding:1rem;background:white;position:relative;-webkit-transition:0.3s all;transition:0.3s all;}.css-18kuraq svg{fill:var(--theme-ui-colors-text);margin:0 0 0 0.25rem;-webkit-transition:0.3s all;transition:0.3s all;}.css-18kuraq:hover{background:var(--theme-ui-colors-tertiary);}@media (hover: none){.css-18kuraq{background:white!important;}}</style><div class="css-18kuraq er8hy5f1">1<!-- --> <style data-emotion="css 11hydmf">.css-11hydmf{font-size:1rem;background:none;border:none;cursor:pointer;position:absolute;width:100%;left:0;right:0;bottom:0;top:0;color:transparent;}.css-11hydmf option{color:black;}</style><select class="css-11hydmf er8hy5f0"><option selected="" value="">1</option><option value="2">2</option><option value="3">3</option><option value="4">4</option><option value="5">5</option><option value="6">6</option><option value="7">7</option></select>/ <!-- -->7<!-- --> <style data-emotion="css 16zxbbs">.css-16zxbbs{padding:0;width:0.6rem;}</style><svg viewBox="0 0 292.362 292.362" class="css-16zxbbs e18bq5uy0"><path d="M286.935,69.377c-3.614-3.617-7.898-5.424-12.848-5.424H18.274c-4.952,0-9.233,1.807-12.85,5.424 C1.807,72.998,0,77.279,0,82.228c0,4.948,1.807,9.229,5.424,12.847l127.907,127.907c3.621,3.617,7.902,5.428,12.85,5.428 s9.233-1.811,12.847-5.428L286.935,95.074c3.613-3.617,5.427-7.898,5.427-12.847C292.362,77.279,290.548,72.998,286.935,69.377z"></path></svg></div><div><style data-emotion="css 1mg2dex">.css-1mg2dex{background:var(--theme-ui-colors-primary);color:white;padding:1rem;border-radius:2px;margin:0 0 0 0.5rem;cursor:pointer;-webkit-text-decoration:none;text-decoration:none;-webkit-transition:0.3s all;transition:0.3s all;}.css-1mg2dex:hover{background:var(--theme-ui-colors-highlight);}@media (hover: none){.css-1mg2dex{background:var(--theme-ui-colors-primary)!important;}}</style><a style="order:3" class="css-1mg2dex er8hy5f2" href="/tag/dataengineering/2">Next <span>→</span></a></div></div></div></div><style data-emotion="css vdyr8l">.css-vdyr8l{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;-webkit-align-items:flex-start;-webkit-box-align:flex-start;-ms-flex-align:flex-start;align-items:flex-start;margin:0 auto;max-width:1050px;}</style><footer class="css-vdyr8l e12cejif2"><style data-emotion="css w1k8v7">.css-w1k8v7{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-box-flex-flow:row wrap;-webkit-flex-flow:row wrap;-ms-flex-flow:row wrap;flex-flow:row wrap;-webkit-box-pack:justify;-webkit-justify-content:space-between;justify-content:space-between;-webkit-align-items:flex-start;-webkit-box-align:flex-start;-ms-flex-align:flex-start;align-items:flex-start;width:100%;border-top:1px solid var(--theme-ui-colors-secondary);padding:1em 0 2em;margin:0 1.5em;}</style><ul class="css-w1k8v7 e12cejif1"><style data-emotion="css 18gjhgp">.css-18gjhgp{display:inline-block;padding:0.25em 0;width:100%;}@media screen and (min-width: 35em){.css-18gjhgp{width:auto;}}.css-18gjhgp a{font-weight:600;-webkit-transition:all 0.2s;transition:all 0.2s;color:var(--theme-ui-colors-text);}.css-18gjhgp a:hover{color:var(--theme-ui-colors-highlight);}.css-18gjhgp a:visited{color:var(--theme-ui-colors-text);}</style><li class="css-18gjhgp e12cejif0"><a href="https://www.contentful.com/" rel="nofollow noopener noreferrer" target="_blank"><img src="https://images.ctfassets.net/fo9twyrwpveg/44baP9Gtm8qE2Umm8CQwQk/c43325463d1cb5db2ef97fca0788ea55/PoweredByContentful_LightBackground.svg" style="width:100px" alt="Powered by Contentful"/></a></li><li class="css-18gjhgp e12cejif0">COPYRIGHT © 2020 by<!-- --> <a href="https://github.com/Swalloow" target="_blank" rel="noopener noreferrer">@swalloow</a></li></ul></footer><style data-emotion="css-global o2wd2y">html,body,div,span,applet,object,iframe,h1,h2,h3,h4,h5,h6,p,blockquote,pre,a,abbr,acronym,address,big,cite,code,del,dfn,em,img,ins,kbd,q,s,samp,small,strike,strong,sub,sup,tt,var,b,u,i,center,dl,dt,dd,ol,ul,li,fieldset,form,label,legend,table,caption,tbody,tfoot,thead,tr,th,td,article,aside,canvas,details,embed,figure,figcaption,footer,header,hgroup,menu,nav,output,ruby,section,summary,time,mark,audio,video{margin:0;padding:0;border:0;font-size:100%;font:inherit;vertical-align:baseline;}html,body{background:white;height:100%;}.siteRoot{height:100vh;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-flex-direction:column;-ms-flex-direction:column;flex-direction:column;}.siteContent{display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-flex-direction:column;-ms-flex-direction:column;flex-direction:column;-webkit-flex:1 0 auto;-ms-flex:1 0 auto;flex:1 0 auto;}footer{width:100%;}article,aside,details,figcaption,figure,footer,header,hgroup,menu,nav,section{display:block;}@media screen and (min-width: 35em){html{margin-right:calc(-100vw + 100%);overflow-x:hidden;}}ol,ul,li{list-style:none;}blockquote,q{quotes:none;}blockquote::before,blockquote::after,q::before,q::after{content:'';content:none;}table{border-collapse:collapse;width:80%;border:1px solid #ccc;}th,td{border:1px solid #ccc;padding:10px;}th{background-color:#f2f2f2;}td{text-align:center;}*{box-sizing:border-box;}body{line-height:1;font-size:100%;font-variant-ligatures:none;text-rendering:optimizeLegibility;text-shadow:rgba(0, 0, 0, 0.01) 0 0 1px;font-weight:400;}img{display:block;width:100%;height:auto;}button,input,textarea,select{font-family:inherit;font-size:inherit;background:none;border:none;-webkit-appearance:none;-moz-appearance:none;-ms-appearance:none;appearance:none;border-radius:0;resize:none;}button:invalid,input:invalid,textarea:invalid,select:invalid{box-shadow:none;}button:focus,input:focus,textarea:focus,select:focus{outline:5px auto #5e9ed6;outline:5px auto -webkit-focus-ring-color;}body:not(.user-is-tabbing) button:focus,body:not(.user-is-tabbing) input:focus,body:not(.user-is-tabbing) select:focus,body:not(.user-is-tabbing) textarea:focus,body:not(.user-is-tabbing) a:focus{outline:none;}</style></div></div><div id="gatsby-announcer" style="position:absolute;top:0;width:1px;height:1px;padding:0;overflow:hidden;clip:rect(0, 0, 0, 0);white-space:nowrap;border:0" aria-live="assertive" aria-atomic="true"></div></div><script id="gatsby-script-loader">/*<![CDATA[*/window.pagePath="/tag/dataengineering";window.___webpackCompilationHash="3eacc184d38ef025e008";/*]]>*/</script><script id="gatsby-chunk-mapping">/*<![CDATA[*/window.___chunkMapping={"polyfill":["/polyfill-d094170835888e167009.js"],"app":["/app-ab1b2a0835a876cd6f2b.js"],"component---cache-caches-gatsby-plugin-offline-app-shell-js":["/component---cache-caches-gatsby-plugin-offline-app-shell-js-a5a38e197924689a49f0.js"],"component---src-pages-404-js":["/component---src-pages-404-js-4ac76ba22be2a98a7ead.js"],"component---src-pages-contact-js":["/component---src-pages-contact-js-b42a9daadcb3f6c5075a.js"],"component---src-templates-page-js":["/component---src-templates-page-js-52c8e087d25d19abffa2.js"],"component---src-templates-post-js":["/component---src-templates-post-js-7da875d0b1e34eafe98a.js"],"component---src-templates-posts-js":["/component---src-templates-posts-js-69f10c35d9ff045cba55.js"],"component---src-templates-tag-js":["/component---src-templates-tag-js-91981983ecde30bf3336.js"]};/*]]>*/</script><script src="/polyfill-d094170835888e167009.js" nomodule=""></script><script src="/app-ab1b2a0835a876cd6f2b.js" async=""></script><script src="/framework-bcc6f24e0b0ce4807ff0.js" async=""></script><script src="/webpack-runtime-ee8b5763a1fb567dc95c.js" async=""></script></body></html>
\ No newline at end of file